本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【图】AI Talk | 视频访谈百度IDL林元庆:百度大脑如何在人脸识别上战胜人类「最强大脑」

时间:2017-01-08 00:32来源:118论坛 作者:www.wzatv.cc 点击:
2017 年 1 月 6 日,百度首席科学家吴恩达带着小度机器人来到了《最强大脑》现场,与人类选手展开了对决,并在人脸识别比赛里以 3:2 的比分赢得胜利。Master 事件引发大众热议人工智

2017 年 1 月 6 日,百度首席科学家吴恩达带着小度机器人来到了《最强大脑》现场,与人类选手展开了对决,并在人脸识别比赛里以 3:2 的比分赢得胜利。Master 事件引发大众热议人工智能的余热未退,小度机器人又在跨年龄人脸识别挑战中战胜了本届最强大脑队长王峰——拥有数个世界冠军头衔的「世界记忆大师」。与以往主要考验空间搜索能力的人机 PK 不同,此次比拼主要集中在识别领域,而识别过程中需要模糊推理的能力,百度深度学习实验室(IDL)主任林元庆坦言,这场应战也并不轻松。

对于此次比赛任务,百度 IDL 人脸团队主要是使用了「度量学习」,即通过学习一个非线性投影函数把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。同时考虑到跨年龄人脸数据的稀缺性,百度大脑使用了一个用大规模人脸数据训练好的模型作为「底座」,然后用跨年龄数据对它做更新。这样不容易过拟合。然后再将这两点结合起来做端到端的训练,从而大幅度地提升了小度跨年龄人脸识别的识别率。

从这期节目开始,机器之心将通过访谈视频「AI Talk」持续为大家解读百度参加最强大脑比赛的多项技术原理,还原 IDL 筹备比赛的细节故事。

下面是机器之心对百度深度学习实验室(IDL)主任林元庆独家专访完整版文字:

机器之心:请简单介绍一下人脸识别。

林元庆:人脸识别简单说就是给你一张人脸的照片,然后我希望能识别照片里面是哪一个人。

人脸识别其实有两种技术。

一种技术我们经常叫 1:1 的人脸比对,比如像银行的应用场景,就是你给一个身份证信息,然后再给一张人脸,通过比对希望知道这张人脸是不是身份证上面的那个人。系统会拿这个身份证的信息给到公安的系统里面取一张照片回来,然后跟你现在的照片比对看是不是同一个人。

还有一种更通用的 1:N 人脸识别,N 可以是几千、几万或者几十万进行比对,这叫 1:N 的比对或者是 1:N 的人脸识别。

机器之心:机器是通过哪些特征进行人脸识别的?

林元庆:深度学习还没有特别流行起来之前,一般会设计一些特征对人脸进行识别。现在用深度学习的方法其实是一层一层的去学不同的特征,底层会是非常低级别的特征,越往上会学到一些非常高级别的特征。像我们的系统应该是千万到亿的低级别特征,慢慢一层一层学上去,最后那一层其实只有 128 个特征。

机器之心:在不同的应用场景中,机器学习算法如何决定人脸特征点的的数目?

林元庆:像我们现在做的方法,在不同的应用场景里面其实特征数目是确定的,只是可能会是不同的特征。特征数目的大小是由深度学习的架构决定的。一旦我们把神经网络的架构确定下来,这个数目就是固定的。我们只是根据不同的场景(不同的场景意思就是不同的训练数据)训练出来的特征可能是很不一样的。因此在不同的场景里面特征数目可能是一样的,但具体特征会是很不一样的。

机器之心:比赛中,小度机器人能将少年时期和中年时期的人脸识别出来,如果是将年龄扩大拉长,婴儿和老人的照片是否可以识别和匹配出来?

林元庆:跨年龄识别是非常难的。就我们现在的系统,年龄跨度在 20 到 30 岁的时候我们仍然能做到比较高的精度。当我们把这个跨度进一步增加到 50 岁或 60 岁的话,难度肯定也会进一步增加,精度会下降。我们还没有很仔细地做过这么大年龄跨度的实验。这是我们下一步要做的事情。

机器之心:介绍一下跨年龄人脸识别使用的度量学习?

林元庆:我们这次去参加《最强大脑》的这套系统,使用的其实是基于深度学习的端到端的度量学习方法 (Metric Learning)。这个方法通过学习一个非线性映射函数(用深度神经网络模型),把图像空间投影到一个 128 维的特征空间中。深度学习要实现的是,对于同一个人的两张照片,不管年龄差距有多大,它们映射到这 128 唯特征空间的两个点(即两个 128 维的向量)要离得很近;对于不同人的两张照片,它们映射到这 128 唯特征空间的两个点要离得足够远 – 即使他们年龄相近。当这个映射函数学习好之后,看两张照片是否是同一个人变得简单:把他们映射到这个 128 维的空间了,如果映射到的两个点离得近,那这两张照片就是同一个人,否则就是不同人。因此核心是如何训练这个用深度神经网络建模的映射函数,即通过调整深度神经网络的参数。我们用大规模人脸数据训练出深度神经网络模型,实现高识别率。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容