王昱珩肩负着捍卫人类尊严的使命,更是在比赛中放出豪言将成为百度大脑的“滑铁卢”,并私下同节目组沟通要求把识别环境的光线再调暗20%,进一步加大了识别难度。 然而随着比赛结果揭晓,挑战要求识别的三名识别对象,百度大脑找出了两名,王昱珩却一名都未找对。。在《最强大脑》舞台上与人类的三场对战中,百度大脑两胜一平,保持不败。 而在第一场人机大战人脸识别的比拼中,双方进行了两轮较量,需要根据年龄跨度近二十年的照片中找出真人。百度大脑最后以3比2战胜人类记忆大师王峰,尤其是根据一张模糊的童年照片,从一对高度相似的双胞胎中准确地认出了识别对象,完成了常人无法完成的任务。 在第二场的听音辨人中,比赛项目则是从21位性别相同、年龄相仿、声线极为相似的专业合唱团中,选出三位每个人读一句话,加密后成为断断续续的声音样本再交给百度大脑和人类选手,要求他们从合唱声音中识别出三名线人的声音。百度大脑与被誉为拥有“绝对听力”的孙亦廷1比1战平。在备选的3人中,双方都只选对了1名。有趣的是,赛后百度语音识别团队的成员称,百度大脑内置的两道算法分别认出了两名备选人,然而在进行算法融合时,“出现了小概率事件”,只筛选出了一人。这似乎是想说明百度在语音识别方面的能力也是强于人类的。 人机大战背后 百度做了哪些事 对于百度的人工智能技术,需要补充一点背景。 科大讯飞研究院院长胡郁认为人工智能主要分为三个维度,同时它们也代表了人工智能发展的三个阶段:运算智能、感知智能、认知智能。 在之前数十年,人工智能呈现的主要是最底层的运算智能,表现形式即各类的计算平台。 而在上世界80年代,人工智能领域从人脑的神经系统模式中吸取灵感,构造出了人工神经网络,使人工智能开始步入感知智能阶段。 这种新的运算模型用自身结构的复杂性简化了运算的难度,通过把占据不同权重的神经元连接起来并行分布式运算,一定程度上克服了传统运算程序难以处理非结构化信息的短板。由此,它使得人工智能获得了深度学习的能力:无需人工对数据做复杂的预前处理,就可以从大量的数据中抽取出它们更深层的共同特征。 用人话说,这种方式绕开了把复杂问题表述为计算机语言的过程,通过简单粗暴的大数据训练来解决问题,它并不回答“熊长什么样”,只是看足够多的熊,来获得认出熊的能力。 这两年,人工神经网络的成果极大地促进了人工智能领域在计算机视觉与自然语言处理方面的进步,让计算机获得了“看”与“听”的能力。 百度的面部识别和语音识别,对应的就分别是感知智能中的“看”与“听”。 面对人类顶尖高手的车轮挑战,百度大脑为何能保持不败?主要在于以下三个方面。 1、海量数据与训练 在百度方面的说法中,其人脸识别准确率达到了97.7%。在人脸识别技术两个最为权威的国际评测FDDB与LFW中,百度都获得了第一名。而这个成绩背后,是巨大的数据与海量的训练。百度大脑团队称其通过超过2亿的面部图像数据来进行深度学习,用大规模的训练,让百度大脑自身建立了一整套人脸特征提取与比对模式,成为了人脸识别方面的专家。 而在声音方面,百度同样拥有庞大的数据库。并且在上节目前两个月,百度大脑团队就开始特别面向声纹识别对算法进行了优化以及训练。 2、过目不忘的记忆 同时百度大脑在记忆力上占据绝对的优势,信息一旦进入其存储单元就可以被原封不动地保存与提取。而人类选手却不得不担心遗忘以及后摄信息对之前记忆的干扰。在节目的赛程设计中,主要信息都是需要记忆的,这使得机器的胜算大大增加。 3、没有情绪问题 尽管百度方面特意拿出了“小度”这样一个萌萌的机器人来与现场进行互动,营造亲和感。然而它其实是由人工控制的,其互动语音都是工作人员打的字。百度大脑没有感情,没有压力,不会犹豫。它既不会感受到百度工程师团队对它倾注的殷切期望,也听不到现场观众的喝彩或者嘘声。它只是一个冷冰冰的任务执行者,不会有任何人类选手所谓的临场感、情绪波动,只会根据任务进行对比,给出匹配概率。 (责任编辑:本港台直播) |