我们从讯飞的角度,看到未来两大重要的产业机遇,第一,3到5年之内,万物互联时代到来,以语音为主、键盘触摸为辅的人机交互时代正在到来;第二就是5到10年人工智能一定会像水和电一样进入每一个行业, 深刻改变我们的世界。那么在这个过程中,我们的技术现状,以及产业界的准备大体如何,我想跟大家做一个分享。
首先关于人工智能技术,有两种分类,一种是分为强人工智能和弱人工智能,另一种是讯飞研究院提出的跟我们技术演进路径相关的这样一个分类,分成计算智能、感知智能和认知智能。 计算智能就是机器能存会算,就像当年IBM的深蓝电脑下象棋超过卡斯帕罗夫,典型的就是因为运算能力强, 提前算到了所有的结果。 感知智能,比如语音合成技术能够让机器开口说话,讯飞的汉语语音合成做到了4.5分,播音员是五分;今年5月份的全球语音合成大赛,英语我们也超过了人工,现在是4.2分,全世界第二名是3.9,j2直播,普通人是4.0分。语音识别技术就像今天现场我讲话,后台的系统把它变成文字,准确率可以做到95%。人工最好的语音转写准确率,只能做到80%。感知智能机器正一个在又一个的领域超越人工。 最大的挑战,或者说大家最热切的期待是什么?是认知智能。怎么样让机器具备能理解会思考的能力?农业革命之后,工业革命让我们从繁重的体力劳动中解放出来;未来的认知智能会使人类从今天很多痛苦的复杂脑力劳动中释放出来。在这里面,科大讯飞选择了一条路,就是以语音为入口的认知革命。 科大讯飞今天启动了语音和语言为入口的认知革命,我们承担了国家科技部第一个人工智能重大专项叫高考机器人。在美国,华盛顿大学图灵中心的目标是未来的人工智能考上美国的大学,日本希望2021年让机器人考上东京大学。中国的第一个项目也是高考机器人,看起来是考大学,其实核心技术是语言理解,知识表达、联想推理和自主学习。今天在数学物理的选择填空题上,机器已经可以做到跟人类的平均水平差不多了,最难的是自然语言理解——这就是讯飞提出来的要以人机交互为入口的目的。这个入口可以把我们人类的智慧最方便的汇聚到后台,供机器学习和训练,也可以使得我们后台人工智能的成果最简单直接的反馈给现实社会,取得它不断学习的反馈,然后在这基础上实现知识管理和推理学习。 我们可以看看今天讯飞超脑计划的一些阶段性成果。一个是刚刚我已经提到今年的全球语音合成大赛。在英文比赛中,科大讯飞是全世界唯一语音合成超过普通人讲话的。2014年,科大讯飞首次参加国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation),即在中英和英中互译方向中以显著优势斩获第一;随后在2015NIST中英机器翻译评测大赛中获得人工评价环节翻译结果可用性比例最高的优异成绩。今年,科大讯飞又获得了第四届国际多通道语音分离和识别大赛(CHiME-4)赛事全部三个项目的冠军。这也是为什么今天在奥迪奔驰宝马,在日系的雷克萨斯轿汽车环境下,全世界的语音识别只有讯飞技术能使用。在今年的全球人工智能比赛Winograd Schema Challenge中,科大讯飞也是全球第一。在人工智能的测试的过程中还有一个概念叫六龄童测试,因为人类的学习和机器最大的不同。我们人类,在6岁之前,我们的基本常识判断具备了,后来学习大量的知识成为我们人类很痛苦的学习经历,机器不一样。机器在后面的知识学习几乎是一秒钟就可以全部完成,最难的是六龄童前期的推理和逻辑。所以Winograd测试一定意义上是考察这个能力的。我很高兴告诉大家,今年的国际测试,我们讯飞代表中国拿了全世界第一。 那么另外一个就是认知计算,高考机器人最难的是自然语言理解。我们在过去曾经说过,我们在英语口语中机器代替人工进行比赛,在广东省高考中我们的技术已经正式使用,而且是全世界唯一使用的。那么今年我们又有更大的进步,在英语作文,在语文作文中,机器阅卷已经超过人工专家了。这就是为什么说我们在考试中间的技术成果,它可以用来影响一个又一个的不同行业。 (责任编辑:本港台直播) |