在讯飞2015年发布会之后,2016年5月份谷歌开始发布英文转写,国内也有一些公司开始跟风,但是我想告诉大家,即便到今天为止,能够任意人不用做任何训练,能够在不用联网的单机情况下,满足保密和网络的各种不同异常环境下,能够做到百分之九十几的准确率,全行业到迄今为止只有科大讯飞一家。 今天我还想告诉大家的是,当时我还发布了万物互联时代最重要的人机交互的几个关键特征:一个特征是远场识别,我们可以在3到5米,5到8米之外,用语音跟机器人、智能家居交流,可以多轮对话,上下文可以随时随地打断。我们定义了万物互联时代的语音交互标准,并且推出了人工智能人机交互平台AIUI,这平台当时以叮咚音响为应用代表,不光可以听音乐,可以控制所有家居。 今年5月份,谷歌发布会也推出来了类似的产品谷歌Home。我想这是万物互联时代,业界英雄所见略同。但是我想更进一步告诉大家,面对未来真正的万物互联,我们中国企业不再仅仅是在跟风,而是要引领和推动整个产业的到来。就语音来说,最重要的就是在交互过程中远场识别和噪音环境下的语音识别,以及在多个人同时讲话时语音识别能不能达到使用标准。 国际上有一个非常著名的语音识别比赛,在噪音口音和多人情况下进行,那就是CHiME国际语音识别大赛,这个比赛的研讨会今年就是在谷歌公司举行,我很高兴告诉大家,几乎全球顶尖机构全部参加的情况下,科大讯飞在所有3项指标中都是全球第一名。 而且,在六麦克风这个最难的麦克风场合下,我们的准确率已经可以做到97%以上,也就是我们亲爱的老罗同志在锤子发布会上说97%的准确率。准确率不是中文而是英文的在谷歌做的国际比赛的结果,并且在噪音环境下我们的错误率只有2.24%。这些的识别技术,都会真正的推动我们整个产业的革命和创新。 今天我们也有自己非常著名的长安汽车的董事长到场,其实到目前为止,根据宝马、奔驰这些国际大厂测试,汽车速度在100公里以上、空调打开的噪音环境下,目前为止,只有科大讯飞的独家技术能够做到使用。 在机器翻译领域,2014年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展,国际口语翻译大赛 IWSLT 我们获得了全球第一,这个第一是具有历史意义的,因为以前国际翻译大赛,汉英国际比赛都是日本研究机构全球第一,英汉国际比赛都是美国机构全球第一。2014年11月的这次比赛,终结了这个历史,科大讯飞英汉和汉英都是全球第一名。在这基础上,2015年2月,美国国家标准技术研究院也就是NIST 组织的机器翻译大赛中我们继续是全球第一,今年,我们又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译,所以我在今天一开场讲话时,大家就可以看到两边屏幕上不光有中文,对应的还有英语,有维语出来。除了维语,还有藏语。其实我们同样的还有日语和韩语的同步翻译,未来我们要把世界所有主要语种全部放进去。 我想跟大家说,今天我们展示的成果,绝不仅仅是我们的发布会演示会上经过定制的成果,就在4天前,上海高级法院招待了11个国家的法院大法官和高层管理者。上海高院如此高端的接待中就是用我们的听见给他做实时翻译,得到了所有参会的国际友人的高度评价,所以我想这已经不是一个概念,而是切切实实的用我们的技术在一个又一个的行业和专业领域给我们带来更便捷的生活,带来更美好的沟通。 去年发布会上,我们还告诉大家人工智能未来的核心是认知智能,而以语音和语言为入口的认知计算,是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的可以说是皇冠上的明珠的认知计算领域,又取得了令全球瞩目的成果。我们在今年参加国际非常知名的Winograd的认知智能的测试,获得全球第一名。这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关。 这就是看机器真正的认知结果,我在这里给大家看的一个例子,比如说这是一个比赛的原题,当然是英文的,父亲如果举不起孩子,是因为他太重,那就会要继续判断到底是谁重,机器要知道说这是因为孩子重,如果说举不起孩子,是因为他太虚弱,到底是谁虚弱,这是因为父亲虚弱,这些的基本推理对人类看起来今天是自然而然的。当机器具备了这样基本的认知判断能力,就可以真正的在一个又一个的领域来学习我们人类最顶尖专家知识。 (责任编辑:本港台直播) |