比赛时,先用帘子先挡着,大家都不知道后面有多少人。嘉宾周杰伦与其中3人通了电话,机器和人类选手听到的声音是被干扰的,模仿手机信号不好声音飘忽、断续的效果。然后帘子拉开,20多人表演大合唱,要我们把与周杰伦通话的“线人”识别出来。 第一名“线人”,孙亦廷、“小度”都没能识别出来。现场单独回放该人的话音的歌声时,普通人都能感到些“端倪”。这一方面是心理暗示在起作用,另一方面是21位专业歌手唱“单声部”,她们的声音融合得太好难以分辨。 第二名“线人”被孙亦廷听了出来,“小度”失手。 第三名“线人”没有被孙亦廷识别出来,“小度”成功扳回一局。 两场比过,1胜1平的“小度”立于不败之地。 在这种情况下,1月20日播出的第三场比赛被一部分观众视为“人类尊严之战”。 第三场:“弱光动态人脸识别”,由“水哥”披挂上阵 节目预设是3个盗贼带着口罩和帽子在灯光很暗的环境下抢劫,被高位摄像头、行车记录仪和手机偶然拍到。拍摄光线弱、人在迅速移动而且面孔被口罩、大沿帽遮挡。选手要从30名群众演员中找到3个“盗贼”。 最终“小度”以2:0获胜,但“水哥”三道题的备选答案中都包括正确选项。 这正是人与机器的得大不同:人会疲劳、会冲动、会心神不安、会有一念之差,机器不会。换一个时间、地点或者心情,“水哥”可能做出不同的选择。 深度学习 以跨年龄人脸识别为例,林元庆讲解了“深度学习”的原理。 众所周知,人的五官在长大后会变,脸型也有可能会变,还有可能整容。 王峰在现场发问:“这些志愿者里面,会不会有人整过容?”嘉宾回答:“这个不能说。整容与否这个因素,对人和机器都是一样的障碍,所以比赛依然是公平的。” 因此跨年龄“人脸识别”考验的不单纯是图像比对。 林元庆介绍说,他们做了一个深度学习框架:把人脸分为七个部位,给机器大量存在相互关系的照片以供训练、学习( 如AAA号、DFK号与ABX号都是同一个人的照片),让机器自已总结哪些特征能够跨过岁月。在比赛前,百度机器人已经“学习”了2亿张照片,总结出72个关键点,进一步得到128维的特征。 “水哥”解释为什么失利时说:我每组都留下了两个备选答案( 此次比赛,正确答案都包含其中)。二选一时,我就不看五官了,只用耳朵和鬓角的细节去校正。节目组后来告诉我,照片是一个月前拍的,“一个长了青春痘,一个刚刚理了发,另一个一直没理头发,头发长长了!” 学习了2亿张照片的“小度”经验更丰富,没有受“青春痘”、“头发长长”的影响。 值得注意的是,远不如机器“勤奋”的“水哥”只是惜败。说明人类,特别是有专长的人,有一些只可意会不可言传的能力。 “人机大战”下半场 去年王兴“中国互联网已经进入下半场”之论甚嚣尘上,也有许多人不以为然:没人知道整场比赛的全貌,凭什么断定上半场结束了? “人机大战”倒是可以分为上、下半场: 上半场,人类为自己的败绩感到幸喜。从1776年瓦特发明蒸汽机,人类幸福地败于火车、汽车、飞机……二十世纪四十年代计算机被发明了出来,人类在引以为傲的智力领域又屡尝败绩,记忆、运算、应变…… 下半场,人类对机器的每场胜利感到忧心忡忡。 其实只要机器仍能为人类所用,“可以替代人类工作”就一点不可怕。别的不说,各种交通工具( 汽车、火车、轮船、飞机……)运输的货物用人力搬运就得用几十亿人。 在“人机大战”下半场,我们会痛并快乐着。一方面享受人工智能、深度学习的“福利”,另一方面担心机器人“功高震主”。 各式各样的比赛也会层出不穷,奥运会项目可以一个个拿来玩,比如和“人形机器人”打羽毛球、乒乓球……
(责任编辑:本港台直播) |