从“竞赛”角度,人类与机器并不在同一起跑线,但也就在那次节目上,初为人母的章子怡女士感慨道:“我们有很多的失踪儿童,他成长了之后可能连父母都认不出来他的样子,但小度可以帮我们辨别出来,所以小度要为人类作出更多贡献。” 不知道李彦宏的两会提案,是否与此有关。 人脸识别技术路径 在我看来,已颇为成熟的人脸识别技术,倒不失为一次理解机器思维的好机会。换句话说,李彦宏让这份提案落地的技术路径是什么? 事实上,人脸识别的实现大体可分为四步。第一步当然是人脸检测:根据眼睛,眉毛,嘴巴,鼻子等器官特征和相互几何位置关系检测人脸。第二步则是人脸图像预处理:如前所述,原始图像由于受各种条件的限制和干扰,很多时候无法直接使用,必须在早期阶段对其进行灰度校正,噪声过滤等图像预处理。进一步剖析的话,这种预处理主要包括人脸对准(得到人脸位置端正的人脸图像),图像增强(改善图像质量,在视觉上更清晰,且让图像更利于计算机的处理与识别)以及归一化(取得尺寸一致,灰度取值范围相同的标准化人脸图像)等工作。 人脸识别的第三步就是脸图像特征提取——这一步是针对人脸某些特征进行的,也是对人脸进行特征建模的过程。最后一步,即是输出结果的匹配与识别:将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。 以上是适用于所有识别用途的理论路径,但李彦宏在提案中涉及的场景则更为复杂:“可能孩子是在很小的时候走失的,但他再进入公众视线可能已经上小学了——比如办学生证的时候需要拍照片,这种情况下通过人工智能的比对,就有可能比以前更加高效的帮助有关部门和家庭找到走失儿童。” 就像章子怡冀望的那样,对比走失儿童是“跨年龄人脸识别”技术最具社会价值的实现场景。但在影响人脸识别率的所有因素上,时间往往是最难对抗的部分,原因之一是跨年龄识别中类内变化通常会大于类间变化;另外,跨年龄训练数据难寻,若没有海量数据,深度学习神经网络便很难学习到跨年龄的类内和类间变化。 不过就像在《最强大脑》中展示的那样,百度也提出了完善的解决方案:针对第一点,百度深度学习研究院“人脸团队”选择用度量学习的方法,通过学习一个非线性投影函数,把图像空间投影到特征空间中,在这个特征空间里跨年龄的同一个人的两张人脸距离会比不同人的相似年龄的两张人脸的距离要小;而针对第二点,考虑到跨年龄人脸的稀缺性,百度通过一个用大规模人脸数据训练好的模型作为底座,atv,然后用跨年龄数据对他做更新。而将上述两点结合,通过端到端的训练,即可以大幅提升跨年龄识别的识别率。 这也正是李彦宏此次提案的理论基础。 培育共识 事实上,在准备两会提案时,李彦宏已非常确信技术本身的成熟度。毕竟百度人脸识别准确率已高达99.7%,何况在人脸识别最权威的国际评测——FDDB与LFW中百度获得了双料世界第一。另外百度细粒度图像识别技术在Stanford Dogs,UCSD Birds(CUB-200-2011)等公开测试中也保持世界领先的识别精度。 但更让李彦宏自信的是,让技术落地从来都是检验技术的唯一标准。其实人脸识别已广泛应用于诸多领域——最直接的例子是,早在提案前,百度人脸识别就已经用于寻人平台上,平台现对接民政部全国救助寻亲网中近3万条走失人口信息。 不妨再举几个最近的例子:去年世界互联网大会,乌镇便首次启用由百度提供的人脸识别系统,很大程度上提高了检票进景区速度(其实两会也可以如此);人脸识别是百度风控部门实现远程授信的技术基础之一;泰康保险去年底上线了人脸识别I期项目,用于线上微信回访和微信回执两个场景,包括人脸识别前端,公安比对,业务衔接以及后台管理等功能。 总之一切指向一点:从技术(包括成熟度和成本在内),李彦宏的这份提案具有很大的可行性,但历史经验是:让社会系统向更美好的方向演进,技术之外,还需要某种合力。 通过人工智能寻找走失儿童亦不例外,它需要与相关部门相互嵌合,根据场景不断调优。也因为此,李彦宏在提案中的具体建议包括:建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安和交通监控系统相结合等。 (责任编辑:本港台直播) |