中国开云最新官网中国有限公司由海归博士带队,致力于虹膜识别技术研发和产业化十数年,研发的PhaseIrisTM算法专利获得湖北省科技进步三等奖、湖北省专利金奖和中国专利优秀奖。PhaseIrisTM算法的设计考虑了从虹膜图像的
中国开云最新官网中国有限公司由海归博士带队,致力于虹膜识别技术研发和产业化十数年,研发的PhaseIrisTM算法专利获得湖北省科技进步三等奖、湖北省专利金奖和中国专利优秀奖。
PhaseIrisTM算法的设计考虑了从虹膜图像的预处理、分割、归一化到虹膜特征的提取,再到与数据库中模式的比对等一系列流程。
为了验证PhaseIrisTM算法的性能,我们进行了大规模的实验评估。我们采用了自建的高清晰虹膜库,进行了37亿次比对统计,结果显示PhaseIris算法的错误接受率小于千万分之一,同时错误拒绝率小于千分之四。在保持错误接受率为零的情况下,算法能够保持错误拒绝率在千分之四左右。此外,我们还在CASIA数据库上进行了近2W图的应用结果表现,经过近40亿次比对统计,算法能保证错误接受率小于千万分之一,同时错误拒绝率小于千分之二。这意味着,PhaseIrisTM算法在安全性和使用体验之间实现了一个极好的平衡。
这些实验结果不仅验证了PhaseIrisTM算法的高精度,而且证明了其在不同质量的数据库(包括高清晰度虹膜库和CASIA数据库)上的稳健性和兼容性。此外,PhaseIris算法的FAR和FRR的性能指标,比起传统的FEER指标,能更准确地反映出算法的实际应用效果。
PhaseIrisTM算法还具有良好的FAR-FRR曲线分离度,这表示该算法具有优秀的鲁棒性,能够适应各种不同的应用情况,提供出色的安全性和使用体验。这使得PhaseIris算法在高安全属性的应用场景中,如金融、政府机构等领域,有着广泛的应用前景。
以下引用转自美国WorldCoin公司2023年3月23号发布的博客,文章展示亿人规模的虹膜识别性能文章链接
//worldcoin.org/blog/engineering/biometric-performance-billion-person-scale。
在本文中,我们展示了虹膜识别技术能够在十亿人规模上区分个体。我们讨论了不同的操作模式,并评估了随着用户基数增长所预期的误识率。
01介绍
为了对Worldcoin的生物特征引擎所需的性能和准确性进行初步估计,让我们假设一个固定的生物特征模型的场景,即它从不更新,使其性能值保持恒定。
02误识情况
生物特征识别系统可能有两种误识方式:它可能将一个人误认为另一个人,这被称为误匹配,或者它可能无法重新识别一个已经在生物特征数据库中注册的人,这被称为误拒识。对应的比率 - 误匹配率(FMR)和误拒识率(FNMR) - 是任何生物特征系统的两个关键绩效指标。
为了我们的分析目的,我们将考虑三种具有不同性能水平的系统。
●其中一种系统,据约翰·道格曼(John Daugman)在他的论文中报道,其误匹配率为1.1×10−7,误拒识率为0.00014。
●另一个系统由NEC的一种领先虹膜识别算法代表,其性能值如国家标准与技术研究所(NIST)的IREX IX报告和IREX X排行榜中所报道。这些值包括误匹配率为10−8,误拒识率为0.045。
●我们还将当前技术在无控制的户外环境中部署时的保守估计纳入考虑,这代表了Worldcoin概念形成时的最坏情况估计。这些值包括误匹配率为10−6,误拒识率为0.005。
03双眼有效性
上述数值是针对单眼性能的,它通过评估真实和冒名顶替的虹膜进行确定。然而,利用双眼可以显著提高生物特征系统的性能。有各种方法可以结合双眼的信息,并为了评估它们的性能,我们将考虑两种极端情况:
AND规则:只有当用户的双眼虹膜都匹配时,才认为用户匹配,这种情况属于双眼匹配。
OR规则:如果一个用户的一只眼睛上的虹膜与另一个用户的同一只眼睛上的虹膜匹配,这种情况属于单眼匹配。
OR规则提供了一种更安全的方法,因为它只需要一个虹膜匹配来识别已注册用户,从而最大程度地减少了为同一人生成第二个用户的风险。从形式上讲,OR规则降低了错误非匹配率,同时增加了错误匹配率。然而,随着注册用户数量的增加,由于高错误匹配率,这种策略可能会使合法用户越来越难以加入系统。
以下是有效率的定义:
FMROR=2FMR(1−FMR)+FMR2
FNMROR=FNMR2
另一方面,AND规则允许更大的用户基础,但以较低的安全性为代价,因为错误匹配率减少而错误非匹配率增加。采用该方法的性能效率如下:
FMRAND=FMR2
FNMRAND=2FNMR(1−FNMR)+FNMR2
第i个(合法)用户遇到错误匹配的概率可以通过以下方程计算:
PFM(i)=1−Pno match with i-1 users in DB=1−(1−p)i−1
其中p := FMR代表错误匹配率。将这些数字相加可以得到第i个用户注册后发生的预期错误匹配数量,即被错误拒绝的用户数。
高错误匹配率会严重影响系统的可用性,因为随着数据库中用户数量的增长,错误匹配的概率也会增加。随着时间的推移,作为新用户被(错误地)拒绝的概率趋近于100%,使得新用户几乎无法注册。
下图显示了使用OR规则和AND规则的生物识别系统的性能。图表分为两个部分,左侧表示OR规则,右侧表示AND规则。图表中的顶部行显示了第i个用户被错误拒绝的概率PFM (i),底部行显示了第i个用户成功注册后被错误拒绝的预期用户数量NFM (i)。图表中的不同颜色对应之前提到的三个系统:绿色代表Daugman的系统,蓝色代表NEC的系统,红色代表最初的最坏情况估计。
此图 在OR规则和AND规则下,生物识别系统在三种不同场景下的性能:蓝线代表NEC的高性能系统,绿线反映了John Daugman报告的性能值。红线表示性能保守的系统。
分析的主要发现表明,当使用OR规则时,随着用户数量的增加,系统的有效性在仅有几开云最新官网用户时就会崩溃,因为新用户被错误拒绝的可能性越来越大。相比之下,采用AND规则为不断增长的用户基数提供了更可持续的解决方案。
此外,甚至当前技术的最坏情况和最佳估计之间的差异也很重要。由于不断进行的研究工作,Worldcoin的生物识别算法性能不断提高。这是通过超越最先进技术,用深度学习模型替换唯一性验证过程的各个组件来实现的,这也显著提高了对真实世界边缘情况的鲁棒性。在撰写此博文时,算法在无控制环境下的性能与上图中所示的绿线图表非常相似(具体取决于FNMR的选择)。这本身就是一个值得注意的成就。尽管如此,我们预计通过持续的研究工作将进一步改进算法的性能。在全球范围内,理想情况是实现消失的错误率。
请注意,对于大量用户(i≫1)和非常高性能的生物识别系统(p≪1),上述方程在数值上变得不稳定。为了计算这种情况下被拒绝用户的数量,我们Taylor围绕p的小值展开了方程的关键部分。
(1−p)i=1−ip+(i−1)ip2+O(i3p3)
以上方程的推导可以在此找到。将其插入上述方程中得到:
NFM(i)= (i−1)ip+O(i3p2)≈(i−1)ip
这是一个有效的近似,只要满足条件i2p≫i3p2↔ip≪1.
在涉及欺诈用户时,他们无法匹配的概率保持恒定,不会随着系统中用户数量的增加而增加。这是因为只有一个其他虹膜可能导致错误的非匹配 - 用户自己先前注册的虹膜。因此,遇到错误的非匹配的概率由以下公式给出:
PFNM=FNMR
预期的错误非匹配数量可以通过以下公式计算:
NFNM(j)=j·PFNM=j·FNMR(其中,j表示第j个不可信用户,他试图欺骗系统。)
结论:我们得出结论,虹膜识别可以在全球范围内确立独特性。此外,为了吸纳数十亿用户,算法需要采用AND规则运行。否则,拒绝率将过高,几乎不可能吸纳数十亿用户。
当前的性能已经超出了最初的保守估计,我们预计该系统最终将超过当前最先进的实验室环境性能,即使在无控制环境下也是如此:一方面,定制硬件包含的成像系统在图像分辨率方面比典型的虹膜扫描仪高出一个数量级以上。另一方面,深度学习和计算机视觉的当前进展为“深度特征提取器”提供了有开云最新官网的方向——这是一种不依赖于手工规则而是从数据中学习的特征提取算法。到目前为止,虹膜识别领域尚未利用这开云最新官网技术。
总的来说,PhaseIrisTM虹膜识别算法不仅具有高精度的性能指标,其基于相位似的设计理念,以及其在大规模实验中证明的鲁棒性和稳健性,都使得它在生物识别技术领域独树一帜。PhaseIrisTM算法的研发,为虹膜识别技术的进一步发展,乃至生物识别技术的广泛应用,都提供了有力的支持。