2016 年是人工智能第一个甲子年,同时也迎来人工智能的又一次复兴。过去的几个月里,人工智能各个领域突飞猛进。3 月,AlphaGo 完胜人类围棋选手李世石九段,震惊世界;4、5 五月间,无论是微软还是 Facebook 的开发者大会,无不将人工智能放在重中之重;9月,随着百度首次向外界全面披露其人工智能成果——百度大脑,基于人工智能的新巨头格局逐渐形成,10 月的一期《财富》杂志用一篇深度报道探讨了百度 、Google、微软、Facebook的人工智能「四巨头」。 11月16日,第三届世界互联网大会在乌镇互联网国际会展中心举行,在最为引人关注的就是世界互联网领先科技成果发布活动中,百度的人工智能核心成果——百度大脑成功入选15大领先科技成果,成为国内唯一一个入选的综合型人工智能技术。 从外媒眼中的 AI 四巨头到互联网大会世界领先科技成果,百度的人工智能到底做了些什么,又踩对了行业发展的哪些关键点? 人工智能基础技术护城河 当前人工智能的侧重点在于基于深度神经网络的机器学习,简称为深度学习。神经网络并非什么新鲜词,但在这几年逐渐成为整个人工智能行业研究的重点,这离不开以下三大领域的突破:算法的优化、计算能力的提升以及海量数据的「喂养」。 在百度的人工智能布局中,PaddlePaddle 深度学习平台,也就是并行分布深度学习占据重要地位。作为内部研发的深度学习平台,构成了百度大脑的算法模型。更重要的是,PaddlePaddle 可以实现 CPU/GPU单机和分布式的训练模式,可以实现数百台机器并行运算,轻松应对大规模的数据训练的任务。 其次,计算能力的高低对于能否实现算法至关重要。百度目前拥有专门为人工智能定制的超高速异构计算集群。这个被称为「AI超级计算机」的产品也构成了百度大脑计算能力的基础。有几个数字可以让我们一窥这个「AI超级计算机」的能力:围绕「AI 超级计算机」的累计产生专利超过60项、相关国际论文数量超过 10 篇、能耗显著下降,实现数据中心平均PUE1.15,相当于每年节省650万度电,每年二氧化碳减排6300余吨。 第三,在数据层面,互联网公司天然具有数据的优势,而百度作为中国最大的搜索引擎,拥有的网页数据、搜索数据、视频数据以及定位数据都位居业界领先地位。在海量数据的喂养下,利用超强计算能力的帮助,完成算法的优化和升级,构成了百度人工智能的护城河,也正如百度首席科学家吴恩达所言:数据会成为百度人工智能火箭的燃料。 四大基础能力 「能听(说)、会看」是衡量当前各大公司人工智能发展水平的重要参考标准。在基础架构竞争之外,这个层面也是各大巨头研发投入的重要领域,包括语音识别/合成、自然语言处理、图像识别等。 以听(说)技能为例,在《麻省理工科技评论》评选的「2016年十大突破技术」中,基于语音识别的对话界面( Conversational Interfaces )成功入围,而要让人机对话有效,不仅要让机器听懂人的话,还要做出适当的反馈,《麻省理工科技评论》认为:百度硅谷实验室研发的语音识别引擎——「深度语音系统2」(Deep Speech 2),拥有一个大型深度神经网络,基于端对端的深度学习技术,可在数百万转录语言库的基础上学习如何将声音和语句联系起来,语音识别率精确度极高。目前的语音识别准确率为 97%。 全球范围来看,语音识别技术已经达到临界点,由此也推动了语音合成以及自然语言处理方面的快速发展。比如基于语音合成技术,用户可以在百度多个产品里体验到与真人语音一样的合成语音,用户只需要按照要求和机器说 50 句话,便可以让每个人拥有自己的声音模型,这项技术目前在手机百度小说频道取得显著成绩,用户听小说的时间从原来的 40 分钟提高到现在的将近两个半小时。 另一方面,自然语言处理作为人工智能领域的一颗「明珠」,在深度学习的帮助下正步入一个全新的爆发阶段。如果说语音识别开启了人机交互的新的一扇窗,那么自然语言处理则成为人机交互下一步发展的助推器。 下面这幅图来自 KPCB合伙人玛丽·米克尔 2016 年互联网趋势报告的分析: (责任编辑:本港台直播) |