要解答这个话题,我想首先要有科学的精神,要用理性的思维来看今天我们的技术,到底可以达到什么样一个阶段,而不是用预言家的角度、非常感性地来做判断。 我想跟大家说的是,人工智能在1956年的达特莫斯会上被提出来时,就是有着非常严谨的科学基础的。当年在达特茅斯会议上,是一批数学家、计算机专家、通讯专家共同提出的人工智能概念,其中包括麦肯锡、明斯基、香农等等。这些大科学家们很多都是图灵奖、诺贝尔奖的得主。人工智能概念被提出来之后,在1970年第一次浪潮达到顶峰时,就已经通过第一代的人工智能神经网络算法证明了《数学原理》这本书中的绝大部分数学原理。第二次浪潮发生在1984年,当时霍普菲尔德网络被推出来,让人工智能的神经网络具备了历史记忆的功能。 但是前两次的大潮,后来都破灭了,为什么?是因为神经网络本身算法的局限性,同时也受到当时整个运算能力的一些限制。那么今天的第三次浪潮,以深度神经网络为基础,基于大数据、云计算运算平台,再加上移动互联网源源不断地把各种训练数据收集到后台。今天我们认为,以目前的时间节点,人工智能的第三次大潮已经切实到来了,它已经不再是一个概念,而是可以进入一个又一个的行业(的技术)。今年3月9号AlphaGO跟李世石对决之前,两会期间几十个媒体采访科大讯飞,当时,基本上业界、舆论和专业界,绝大部分人都认为机器今年很难获胜,但是科大讯飞很坚定地说机器一定大比分领先,为什么?因为围棋后台的算法是基于深度神经网络,这个神经网络其实科大讯飞早在今年之前就已经在很多领域取得了很好的应用成效,全球的科技产业界也做了很好的探索。谷歌(DeepMind)是把它用到了一个大家都很关注又喜闻乐见的围棋领域,这个算法和围绕它的科技和产业界持续的创新,推动了今天人工智能第三次大潮的到来。 2006年,深度神经网络的基本理论框架正式提出来,2011年就开始在语音识别领域崭露头角,科大讯飞是中国第一个把深度神经网络用到语音识别领域的。2010年,我们在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。2011年之后,可以看到2012年在图像识别中,深度神经网络开始异军突起,14年机器翻译取得突破……今年,我们即将让大家看到一个又一个行业的令人欣喜的成果。 讯飞2016年深度学习技术成绩单 首先是语音合成技术。让机器能听会说,首先要给机器装上一个人工的嘴巴。今年,在全球的语音合成大赛暴风雪竞赛中科大讯飞再次获得第一名。今年的比赛比的是什么?比的是英语合成,而且是英语的故事级合成。小说和故事,也就是要求更加深情并茂,难度更大。 但是我非常高兴地告诉大家今年的国际比赛结果:在一堆的国际的顶尖研究机构和产业界精英全部参加的前提下,科大讯飞再次在英文领域获得全球第一名,而且不仅是全球第一,是全世界唯一把英语合成做到了超过普通人说话水平的公司! 比赛中,五分是播音员的水平,四分是普通的说话水平,而今年的国际英文大赛科大讯飞得分是4.2分,第二名只有3.9,也就是说,小说风格,故事风格的语音合成,只有中国人做到超过了普通人的水平。我想告诉大家,这已经不是第一年,科大讯飞连续11年蝉联了全球语音合成大赛的第一名。去年国际组织比的是印地语,我们照样是全球第一,是3.9分。我非常高兴地告诉大家今天的中文我们已经做到了4.5分,播音员是5分,我们在座各位平均下来是4,计算机达到4.5,这个我也很自豪。 当前的中文、英文、印地语的第一名都是科大讯飞代表中国做出来的。我们中国人、中国用户享受了全球语音合成最高水平的成果。 那么在语音合成的进展上,我们再看一下语音识别,大家已经看到我说话的时候,同步的文字字幕转写出来,那么去年12月21号科大讯飞的发布会上是全球第一次,敢于在几千人的会场演讲风格下同步把语音自动转成文字。现场机器跟人的对比结果表明,机器在转写准确率上大大超过了专业速记人员。 (责任编辑:本港台直播) |