最近两天,人工智能频出大新闻,先是AlphaGo的升级版本以神秘Master的身份亮相,横扫国际围棋大师,连胜60场,紧接着百度大脑在《最强大脑》节目中挑落人类脑力精英,一度甚至无人敢于应战。 人工智能在棋类的逻辑中战胜人类也就罢了,在人类天生擅长的视觉感知与辨识上,人工智能也能战胜人类,真是意料之外。科幻小说的场景如今似乎是近在眼前了,那么百度和谷歌的人工智能技术究竟谁更强大?百度和谷歌的双杀又预示着什么呢? 一、AlphaGo攻克逻辑思维 AlphaGO玩的棋类游戏,计算机也很早就超越人类。计算机下棋的原理是蒙特卡罗树搜索,每一步都计算可能,算出结果,选出最优解。围棋成为人类最后的堡垒,是因为围棋的棋盘太大,变化可能太多。算清围棋的每一路变化还不可能。 AlphaGO在本质上,还是10年甚至20年前的技术,蒙特卡罗树搜索,但是AlphaGO在判断上利用上了最新的人工智能技术,它通过千万盘网络棋局学习人类的判断,对落子的点进行优选,这样就不用每个点算清,只要算明白优选点就可以。而且AlphaGO还可以自我对局,不断从实战中优化自己的优选点,还能把棋盘分块,把局部完全算清楚。经过不断进化,在短短一年多的时间里面从业余到专业,再到战胜柯洁。 因为计算机算清楚很多可能,所以就可以下一些人类不会下的点。人类不熟悉,靠棋感,而计算机早就算清了。百度深度学习实验室主任林元庆这样评价:“打一个比喻,比如说有一群山,有山谷,这边和那边的山多有山谷,我们的方法是去找最低的山谷,AlphaGo可以从不同的地方找,人类是从几个范围里面找,AlphaGo在别的地方找的时候,看到的是完全不一样的风景。因此,很可能失去空间,能产生一些非常反常规的内容,对AlphaGo来说不是常规的下法,这是很正常的。” 所以,AlphaGo的核心技术还是10年、20年前的思路,j2直播,最新的神经网络、深度学习成果仅仅用来减少了计算量,做了优选和价值判断。AlphaGo的成功攻克了人类的逻辑思维,但是层次并不高,中国和日本都在短期内做出类似的高水平围棋人工智能。AlphaGo的宣传意义大于技术价值,它更大的意义在于利用围棋对全社会做了人工智能的启蒙,它让大家开始关注人工智能。 二、百度大脑超越人类感知 百度在《最强大脑》上展示超越人类的人脸识别技术,在人工智能方面远比AlphaGo复杂。 传统的人脸识别技术是简单识别人脸轮廓,找几个特征点,然后识别。如果人脸在运动中扭曲,或者光线弱一点,特征不明确,或者有遮挡,或者如果存在一定的模糊,机器都不能识别。所以传统的人脸识别价值很低,无法替代人类对身份的鉴别。 而百度大脑的人脸识别是基于积层神经网络的,人工智能应用于人脸识别是一层一层神经网络的判断。 百度的人脸识别首先对人脸的关键点进行定位,确定要识别的图像或者实体中包含的人脸在哪?然后粗定位,对人脸进行矫正,再做五官特征点的细定位,还要跟踪定位的特征点,而这一步就需要大量的深度学习才能做到准确。然后百度会对人脸做分割,捕获的图像来自于人脸的那个器官,把人脸的轮廓搞清楚,与衣服装饰区分开。这一步算是优选,同样需要深度学习来解决。第三步是判断捕获人脸的一些基本属性,你是亚洲黄种人还是非洲黑人,是男是女,戴不戴眼镜。这里已经有一定的逻辑判断了,归类准确才能正确识别。第四步是对表情动态引发的脸部特征点的变化进行检测,让机器能识别微笑的你和大哭的你是同一个人。还有第五步,第六步…… 这样一层一层下来,每一步都用到深度学习技术,通过亿的参数,千亿的样本和亿级的特征训练。最终达到超越人类的水平。 在上《最强大脑》之前,百度在人脸识别技术两个最为权威的国际评测——FDDB与LFW中已经获得了双料世界第一,而且还在LFW中达到了前所未有的99.77%超高准确率 百度人脸识别不仅可以识别遮挡,暗光,带表情,模糊的影像。通过特征差异的大小,百度大脑还能做跨年龄的人脸识别,能从你幼年的照片推断你中年的照片。用林元庆的话说,“图像识别人工智能已经达到了可以推理的程度。” (责任编辑:本港台直播) |