本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】AI Talk | 百度IDL院长林元庆:击败最强大脑王昱珩背后的技术是什么?(2)

时间:2017-01-22 22:20来源:118图库 作者:开奖直播现场 点击:
林元庆 :我们做系统升级不是因为要和王昱珩比赛,是我们原本就计划要做。所做的升级其实是针对这次比赛的内容—有遮挡的人脸识别。在这次比赛中

林元庆:我们做系统升级不是因为要和王昱珩比赛,是我们原本就计划要做。所做的升级其实是针对这次比赛的内容—有遮挡的人脸识别。在这次比赛中,要识别的人脸可能戴口罩、戴墨镜甚至戴帽子,如何处理这些有遮挡的人脸图片,在人脸识别领域里还是悬而未决的问题。针对遮挡情况,我们也特地设计了一些比较新的算法。比如我们将人脸分为 7 个部分,每个部分的遮挡情况都是根据那个部位在深度学习的输出特征来描述这个部位被遮挡的程度,根据不同部位遮挡程度的不同决策出哪些部位是可以有效提供人脸信息的,进而可以用于人脸识别。简单来讲,就是让模型了解不同部位被遮挡的情况,然后根据情况来使用这个部位的信息。我们训练的是一个端到端的模型,输入照片后系统自动得到不同部位的遮挡信息,最后做综合决策。

机器之心:在这一过程中,小度如何用到推理能力?目前具备的推理能力水平如何?

林元庆:小度在别的方面可能会用到更多的推理能力,比如说自动驾驶。但在人脸识别方面,它的推理能力还是比较初级,比如我们会去分析哪一些部位可能被遮挡,这些部位需要怎样根据这些信息作出最后的判断。从不同方面得到的信息进行相互作用也是需要通过数据和模型去学习出来,因此,在模型设计时就会涉及一些比较基本的推理能力,让小度通过数据去学习。

机器之心:要获得理想的识别结果,对人脸角度和像素分辨率都有什么样的要求?

林元庆:其实我们在左右转向 45 度之内都能做到非常高精度的识别,但如果角度太大,比如说半脸就会很难了,精度会下降。从上往下看或从下往上看,也属于比较难的,上下 15 度左右还比较好处理,但如果角度太大,难度就会比较大。当然,我们也有计划再扩展算法。相比像素分辨率,其实更重要的是图片质量,如果图形都糊了,人都很难分辨出五官,(对机器来说)就更难了。但只要有足够的分辨率,放大之后你还能看到五官,比如说眼睛能看到瞳孔,基本上还是能够识别的比较好,质量越高肯定识别越好。当我们做系统(整体设计)的时候,其实可以想办法提高画面捕捉的水平,比如摄像头可以装得低一些,从一体化的角度来考虑怎么才能取得比较高的分辨率。比如说在一些机场,为了能在人路过时捕捉人脸进行识别,他们把摄像头放在一个大屏幕上,人走过的时候常常会看一下屏幕,这样就有可能捕捉到一个人脸稍正的画面。

机器之心:节目中第一题和第三题,小度都答对了,但第二题被形容错得很离谱,是什么原因造成的?

林元庆:错的很离谱可能指的是,正确答案是一个相对比较胖一点的人,但是小度给的答案是一个胖瘦正常的。这是因为小度可能看的不单单是脸型,看到更多是比如鼻子的形状、嘴角的形状,对小度来说,它根本没有信息来判断人的脸型是不会变的,举个例子来讲,像我们在第一期跨年龄识别里看到,人的脸型完全是会变化的,小度无法得知它看到的这个照片跟库里的照片相比,只是几天或几个礼拜、几个月之前拍摄到的,它只能从原来学习出来的信息里进行判断。其实我们 IDL 工程师们后来仔细去看了结果,除了脸型(胖瘦)因素之外,其实也挺难确定那个人是不是就是最后的人,通过电视仔细看照片也很不容易,反倒是小度的答案的嘴型更接近真实答案。

  

wzatv:【j2开奖】AI Talk | 百度IDL院长林元庆:击败最强大脑王昱珩背后的技术是什么?

机器之心:在百度,这项技术目前仍然停留在技术研究阶段还是即将成为一个产品化的系统?

林元庆:之前,人脸识别主要还是用在百度已有产品覆盖到的场景里,包括全网的人脸搜索、图片的人脸搜索,在百度之外做的非常少。但是从 2017 年开始,我们有计划要把百度人脸识别系统在公司之外用起来,包括我们现在跟景区在做的人脸闸机系统,游客进景区以后就可以刷脸进出,这在乌镇已经落地。在安防领域,水哥曾帮山东省公安厅从监控的视频里找到罪犯,但水哥只有一个,而这个系统其实已经可以做到非常好的识别精度,我们也希望它能够在更多的安防领域用起来。我们希望技术能得到广泛的应用,这也是我们今年需要努力的重要方向,争取把我们的技术落地到更多的实际生活中。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容