6月30日,科大讯飞董事长刘庆峰受邀参加世界智能大会并发表了《人工智能+ 应用是硬道理》的主题演讲。作为亚太地区最大的智能语音和人工智能上市公司科大讯飞的创始人,刘庆峰与到场的数千名重量级业内大咖分享了科大讯飞在人工智能领域的成果,以及人工智能给现代生活带来的改变。 尊敬的各位领导、各位来宾、各位合作伙伴,我非常高兴能够参加今天的世界智能大会。特别是刚才的天津宣言,3条共15项建议,我觉得都说到我们心坎里面去了。下面我就想跟大家分享一下科大讯飞对于人工智能技术进展现状的理解,以及我们认为在哪些领域人工智能正在深刻地改变我们当前的世界。 人工智能的第三次浪潮,依然是泡沫? 今年是人工智能概念提出的第61年,前面张院士也都提到了,人工智能正在进入第三次浪潮。很多人说在前两次浪潮都有浪潮之巅,最后经历大潮破灭,那么第三次浪潮是真的大潮到来,还是有可能仍然是一个泡沫? 确实,我们认为判断这件事情不能用一个预言家的角度去判断,也不是用科普作家的思维,而是真正的要看基数、看产品、看应用环境。人工智能时代确实已经到来了,现在要讨论的只是人工智能将在多大范围、多深的深度、多快的时间来改变这个世界。当今世界已从“互联网+”到达一个新的“人工智能+”的时代。 人工智能的实现的两种路径 人工智能其实有两个主要的实现路径,一个是通过生命科学、通过人类大脑的神经元的传导机制来判断,使得我们机器未来具备推理和学习的能力。我们不是让机器变的像人一样,而是要让机器具备像人一样的推理和学习的能力。 第二个路径就是基于数学建模的方法。这是1956年达特茅斯会议上一些数学家、计算机专家和通讯专家们提出的全新的方向。我们非常认可麻省理工将“强化学习”排在2017年十大突破技术榜单的第一位。强化学习,以深度学习为代表,包括卷积神经网络、递归神经网络等等,这些当前不需要再有更大的突破,就已经可以在一个又一个的领域改变世界的相关技术成果了。 万物互联时代,语音将是重要入口 随着万物互联时代的到来,越来越多的设备没有屏幕了,越来越多的设备需要我们几米之外来操控它。比如说机器人,它必须在几米之外能够交互,能够随时打断。这种大趋势下,语音合成和识别已成为万物互联时代人机交互的最主要的方式。那么假如要机器说话,语音合成要达到何种水平? 前天,2017年国际语音合成大赛竞赛结果公布,科大讯飞再获全球第一,而且比的还是英语。比赛分两个维度,一是自然度,5分是播音员的水平,4分是普通美国大学生的水平。科大讯飞的语音合成技术是唯一达到4分的,机器读英语跟人读一样自然,全世界第二名只有3.6分。二是系统全自动学习,即整个参数模型在没有任何的先验知识的前提下,通过深度学习自己去计算,科大讯飞依然是全球第一,这代表我们用在全世界几乎所有的语种都可以得到这个结果。 科大讯飞是中国第一个把深度神经网络用在语音识别领域的。2010年科大讯飞发布了语音云平台,宣告手机的语音听写时代开始到来。2010年在实验室测试的结果是准确率85%,实际上真实的培训准确率就60%。这证明演示与实用有很大差距。 到了2016年准确率达到95%以上,从60%到95%,35%的提升中20%来自于算法的突破,15%来自数据的积累。现在讯飞开放平台上的过去18个月的累计独立终端破10亿,每天35亿人次使用,已成为全世界最大的语音交互平台,所以使得各种口音都可以识别出来。 讯飞听见智能会议系统不用联网,单机版本不用做任何口音训练就可以做到95%以上的准确率。一年多以前,我们在北京进行过机器和人工在语音识别上的测试对比,机器对播音员的语音识别准确率可以做到近乎百分百,对我的是97%,对李德毅院士的江苏普通话准确率也有百分之九十几,而人工最高准确率只有80%,这就是机器今天带来的变化。但语音识别还有一个最大的挑战是噪音环境,因为万物互联时代,远距离和噪音情况下的数据是什么情况?两年前宝马汽车在一百公里时速、车内噪音全部打开的情况下测试结果,科大讯飞是全球唯一达到实用的,准确率达86.9%。 (责任编辑:本港台直播) |