江苏卫视的《最强大脑》第一集终于落下帷幕,百度大脑最终以3比2的成绩,胜过了人类组选手,作为此次对战项目的负责人,百度深度学习实验室主任林元庆,在赛后接受了媒体采访,对此次节目进行了一次深度的解读。 而这其中也透露了关于人工智能的未来重要趋势。 1 林元庆表示,“参加节目的目的并非打败人类,最重要的是检验百度这几年的技术水平,无论输赢都需要回去继续做研发,开奖,将技术应用到更多的实际项目上。” 事实上人工智能在各种计算能力上,早就超过了人类,而这种简单维度的对比是没有意义的。此次最强大脑对决的是图像识别与语音识别,不是简单的计算能力,因此对于人工智能来说,挑战也是相当大的。 这几年百度在图像识别、语音识别上发力不小,技术大牛吴恩前年达从谷歌加入百度,进行深度学习的研发工作,此外百度的深度语音技术Deep Speech2,还在去年获得了《麻省理工评论》的十大突破性技术,与航天工程、纳米工程等并列,也是唯一入选的中国公司。 而百度在人工智能的各个方向上都布局非常全面的布局、包括深度学习、自然语言理解、语音合成、语音识别、图像识别等等。而百度技术究竟发展到了怎样的程度?这次节目则是一次非常好的机会,通过挑战更高难度的技术,来检视自身技术能力。 2 林元庆表示,“人类比较擅长人脸识别与声音识别,这是人类的优势以及机器的弱势。” 这点比较好理解,我们通常见到的都是人工智能的计算技术,例如百度搜索、淘宝都是用到的大数据推荐技术,但是很少见到有图像识别的应用,正是因为机器向来在这方面比较弱。此前支付宝就曾开启过人脸识别登陆,最后又由于技术能力不足的原因,不得不关闭该功能。 此次的对决,则正是要看一下百度在这两个方向上的技术能力。 3 林元庆表示,“图像识别人工智能已经达到了可以推理的程度。” 此次比赛的其中一个难点在于跨年龄识别,因此最大的难点在于推理能力,通过现在某个人的当前长相去推测其过去的长相,以及通过过去长相推测现在的长相。 简单的人脸识别技术就不多做介绍,因为技术大同小异,这里要说的是跨年龄识别的难点。 对于深度神经学习技术来说,最为需要的燃料就是数据,跨年龄识别,由于数据不够,难以收集,因此很难进行深度学习。而百度方面采取了通过设计非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。此外,百度用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对他做更新,这就在最大程度上保证了准确性。 因此,目前百度在人脸识别上,已经达到了一定的推理能力,机器已经开始可以做一些人类无法做到的事情。 4 林元庆表示,“目前百度的各项人工智能其实已经有所应用,例如乌镇刷脸、无人车、等诸多项目” 事实上,百度是最早落地图像识别的公司,百度内部有一个人脸识别部门,专门针对人脸识别进行研发。在百度图片搜索“魏坤琳”后就会出现大量魏坤琳的照片,非常准确,此外在今年的乌镇世界互联网大会上,百度做到了刷脸识别入场的技术,也给整个乌镇世界互联网带来了很大的惊喜。 而这一技术难度其实相当高,乌镇有成千上万人的人脸数据库,而用户一旦刷脸后,系统就需要在一瞬间进行1对N的比对,而图像数据是极为复杂的多维数据,并非简单的数据索引,此外因为人的脸部着装还会为机器带来极大的模糊性与不确定性,因此技术难度极为复杂,而百度也已经做到高精准的人脸识别,还应用在了百度大厦的门禁之中。 其次在无人车方面,j2直播,百度也在今年的乌镇互联网大会上,实现了全球首个无人车景点试体验,百度宣布的三年商用五年量产并非空穴来风,其背后有着全套的商业支撑体系进行应对。 5 林元庆表示,“判断人工智能价值的标准在于是否落地,有市场应用,有数据。” 仔细盘点人工智能这一路的发展,一直以来起起伏伏,最早的失败者是当年的“飞鸟派”,其希望通过模仿人类思维的方式开发人工智能,最终以失败告终,而其中最大的原因在于,那个年代的技术并不成熟,根本没有太多人工智能用武之地,巧妇难为无米之炊,只能在算法中寻找真理。 (责任编辑:本港台直播) |