在第三次人工智能浪潮来临之时,在语音领域耕耘了 17 年的这家公司走到了哪一步? 「人工智能第三次浪潮究竟是什么?第三次浪潮是不是也像前两次一样很快大潮退去?今天我们对人工智能未来的预测是不是过于乐观?这是一个真正的产业大潮还是概念的泡沫?」
在昨日(11 月 23 日)的讯飞 2016 年度大会上,科大讯飞董事长刘庆峰开篇便提出了以上这些疑问。 其背后是这家在语音行业耕耘 17 年、并不断拓展应用领域、并在锤子发布会后「一夜爆红」的公司,对人工智能行业的思考和落地。 第三次浪潮? 1956 年,人工智能的概念第一次在达特茅斯会议上提出。 1970 年,人工智能迎来第一次浪潮。第一代神经网络算法,可以证明《数学原理》中绝大多数数学原理。 1984 年,人工智能迎来第二次浪潮。霍普菲尔德(Hopfield)网络的出现,让神经网络拥有记忆功能。 「但前两次大潮后来都破灭了,为什么?因为神经网络本身算法的局限性,也受当时整个运算能力的局限。今天,神经网络有了全新进展,深度神经网络成为基础,基于大数据、云计算的运算平台,源源不断地将基于移动互联网的训练数据输送到后台,」科大讯飞董事长刘庆峰在主题演讲中表示,「我们认为人工智能的第三次大潮已经切实到来。人工智能已不再是一个概念,是可以进入一个又一个的行业的。」
2006 年,当年参与达特茅斯会议的专家重聚,左起为摩尔、麦卡锡、明斯基、塞弗里奇、所罗门诺夫。 纵观十年来人工智能行业的进展,似乎一直在为第三次浪潮的到来铺垫:2006 年,Geoffrey Hinton 提出深度学习框架;2010 年,DNN 在语音识别崭露头角;2012 年,CNN 在图像识别领域异军突起;2014 年,RNN 机器翻译中得到应用;2016 年,AlphaGo「战胜」李世石。 得益于互联网、移动互联网的高速发展,深度学习、神经网络等技术获得了海量训练数据。受益于此,科大讯飞也取得了不少瞩目成绩。在今年的全球语音合成大赛 Blizzard Challenge(暴风雪竞赛)中,科大讯飞再次获得全球第一;在今年的 CHiME 国际语音识别大赛中,科大讯飞三项指标均为全球第一;2015 年在 NIST 组织的机器翻译大赛中,科大讯飞获得全球第一;在今年的 Winograd Schema Challenge 认知智能测试中,科大讯飞同样获得了第一。
发布会后,科大讯飞轮值总裁胡郁接受媒体专访 尽管行业和企业有如此多的进展,但前两次的「退潮」不禁让人担忧,第三次浪潮是否也将很快消失?在会后专访中,科大讯飞轮值总裁胡郁表示,「我不能预言退潮……但前两次退潮时人工智能都没能在行业中得到应用。」 三种状态和一个人机耦合的未来 在不同行业应用时,人工智能会有哪些不同特点? 科大讯飞研究院经过分析,将其分为三种主要的状态: 第一种是信息完全输入的状态。在这种状况下,得到一个输入就可以充分准确的得到相应的输出,如会议上的语音转写,安保时的人脸图像识别等,j2直播,这些领域机器将来可以完全替代人工。 第二种是人机耦合的状态。仅仅有输入信息还不够,需要有经验判断和常识,以及不断迭代的专家知识。比如教育、医疗等领域,需要学习顶尖专家的知识并不断逼近他们。 第三种是完全依靠艺术创造的状态。没有输入信息支撑,主要靠创意、想象力。机器可以作图、画画、写诗,但是机器做出的还只是工艺品,真正的艺术还很难达到。
在演讲的同时,讯飞听见可以实时将语音转为文字,并同步翻译为英、韩、日、维等语言 「今天真正的机器替代了大量的传统脑力劳动,将人类解放到更加美好和广阔的创意空间中去,」科大讯飞董事长刘庆峰表示,「这是一个大的趋势。今天越来越多、可以说 80% 的人工智能技术,是集中在第二种状态的。」 (责任编辑:本港台直播) |