根据眼睛、眉毛、嘴巴、鼻子等器官的特征以及相互之间的几何位置关系来检测人脸,即在一副图像或一序列图像(比如视频)中判断是否有人脸,若有则返回人脸的大小、位置等信息。
来源:王映辉《人脸识别——原理、方法与技术》 Step 2 人脸图像预处理 系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理。人脸图像的预处理主要包括人脸对准,人脸图像的增强,以及归一化等工作。人脸对准是为了得到人脸位置端正的人脸图像。图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰,而且使图像更利于计算机的处理与识别。归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像。
人脸图像的预处理 Step 3 人脸图像特征提取 人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也称人脸表征,它是对人脸进行特征建模的过程。
Step 4 人脸图像匹配与识别 人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。这一过程又分为两类: 一类是人脸确认,是一对一进行图像比较的过程,将某人面像与指定人员面像进行一对一的比对,根据其相似程度(一般以是否达到或超过某一量化的可信度指标/阀值为依据)来判断二者是否是同一人。 另一类是人脸辨认,是一对多进行图像匹配对比的过程。将某人面像与数据库中的多人的人脸进行比对(有时也称“一对多”比对),直播,并根据比对结果来鉴定此人身份,或找到其中最相似的人脸,并按相似程度的大小输出检索结果。 本次比赛的一个重要特点是识别跨年龄人物的人脸。影响人脸识别的因素有很多,其中影响人脸检测的因素有:光照、人脸姿态、遮挡程度;影响特征提取的因素有:光照、表情、遮挡、年龄、模糊是影响人脸识别精度的关键因素。而在跨年龄人脸检测中影响因素更多。 一般而言,在跨年龄阶段人脸识别中,类内变化通常会大于类间变化,这造成了人脸识别的巨大困难。同时,跨年龄的训练数据难以收集。没有足够多的数据,基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。 根据百度 IDL实验室主任林元庆的介绍, 对于第一点,百度IDL的人脸团队选择用度量学习的方法。即通过学习一个非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。 针对第二点,考虑到跨年龄人脸的稀缺性。我们用一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对它做更新。这样不容易过拟合。 他说:“将这两点结合起来做端到端的训练,可以大幅度提升跨年龄识别的识别率。” 根据林元庆的介绍,针对人脸识别,百度建立了一个包含 200万人、2亿数据的图片库,比ImageNet大很多。下图是百度人脸训练集与 ImageNet 图片数量的一个可视化对比:
林元庆介绍,在内部数据集上,截止到2016年9月,百度的人脸识别技术已经可以做到2.3%的错误率。 人和机器PK人脸识别,有可比性吗? 在目前的人工智能技术水平下,人和机器比人脸识别,有可比性吗? (责任编辑:本港台直播) |