依图NIST夺冠,解密人脸识别算法原理


    近日,由美国国家标准与技术研究院NIST(National Institute of Standards and Technology) 组织的人脸识别算法测试FRVT2018结果公布,三家中国公司挺进前五。其中冠军被中国公司依图科技再度摘得,中国科学院深圳先进技术研究院获得第二名,排名前五的另一家企业是旷视科技。
    NIST测试以其评测标准的严谨性、一致性和全面性,成为了全球规模最大、标准最严、竞争最激烈、最权威的人脸识别算法比赛。
    依图科技其实是第二次获得NIST比赛人脸识别冠军,去年6月NIST官方公布的测试结果中,依图在千万分之一误报下达到识别准确率95.5%,是当时全球工业界在此项指标下的最好水平。今年依图将这一指标提升到了接近极限的水平,即在千万分之一误报下的识别准确率已经接近99%。根据NIST官方4月发布的竞赛结果,旷视科技也曾登顶榜首,在百万分之一误报下的准确率为97.5%。
    中国公司取得如此战绩,一定程度上代表在人工智能领域,我国的人脸识别技术已经走在世界前列,可喜可贺!为此,小编特别想探究一下人脸识别背后的算法原理。
    1.基于几何特征的方法
    基本思想:采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征。因为人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,所以对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。
    局限性:基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。
    2.特征脸方法(PCA)
    特征脸方法是90年代初期由Turk和Pentland提出的目前最流行的算法之一,具有简单有效的特点, 也称为基于主成分分析(principal component analysis,简称PCA)的人脸识别方法。
    基本思想:该方法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性,然后再计算出它们的几何特征量,而这些特征量形成一描述该面像的特征向量。其技术的核心实际为“局部人体特征分析”和“图形/神经识别算法。”这种算法是利用人体面部各器官及特征部位的方法。如对应几何关系多数据形成识别参数与数据库中所有的原始参数进行比较、判断与确认。
    局限性:特征脸方法是一种简单、快速、实用的基于变换系数特征的算法,但由于它在本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像,所以它有着很大的局限性。
    3.神经网络方法
    基本思想:人工神经网络是一种非线性动力学系统,具有良好的自组织、自适应能力。目前神经网络方法在人脸识别中的研究方兴未艾,但在人脸识别上的应用比起前两类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达,它的适应性更强,一般也比较容易实现。因此人工神经网络识别速度快,但识别率低 。
    局限性:神经网络方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,其识别重要的一个目标就是降维处理。
    影响人脸识别的关键因素
    光照变化
    光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败。目前有两种解决思路:第一是利用光照模式参数空间估计光照模式,然后进行针对性的光照补偿,以便消除非均匀正面光照造成的阴影、高光等影响;第二是基于光照子空间模型的任意光照图像生成算法,用于生成多个不同光照条件的训练样本,然后利用具有良好的学习能力的人脸识别算法,如子空间法。
    姿态问题
    姿态问题涉及头部在三维垂直坐标系中绕三个轴的旋转造成的面部变化,其中垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失,因此姿态问题成为人脸识别的一个技术难题。
    解决姿态问题有三种思路:第一种思路是学习并记忆多种姿态特征,这对于多姿态人脸数据可以容易获取的情况比较实用;第二种思路是基于单张视图生成多角度视图,可以在只能获取用户单张照片的情况下合成该用户的多个学习样本,可以解决训练样本较少的情况下的多姿态人脸识别问题,从而改善识别性能;第三种思路是基于姿态不变特征的方法,即寻求那些不随姿态的变化而变化的特征。