在生态层面,亚马逊、阿里巴巴这样的大公司优势明显。就目前来看,语音交互在整个阿里巴巴硬件体系内的重要性越来越高,比如在 YunOS 系统中,整个语音交互成为一个重要的入口,而 YunOS 早已具备了支持多端的能力,可以在手机、电视、互联网汽车、音箱以及机器人上使用。这也意味着,围绕 YunOS,尤其是语音交互,阿里巴巴整个生态体系正在形成。 3. 语音识别的场景意义大于技术意义 如上文所言,过去几年,语音识别的精确率大幅提升。这也让公众产生了某种误解,意味哪家公司的识别率越高就越好。而在初敏看来,「语音技术如果要变成一个产业,最重要的是 E2E (不同企业之间的产品)打通,从收音,到识别、到理解、到交互、再到服务选择、结果反馈,以及持续交流等,开奖,每一个环节都要流畅,用户用起来才舒服,才会愿意持续使用。」 这也是初敏一直所强调的一点,随着语音识别准确度未来越来越高,公众也不再关注所谓的识别率高低,而是更在意其背后的技术、服务质量,或者说用户使用场景,而对企业来说,首先要突破自然语言理解和交互的技术瓶颈,在此基础上再谋求服务质量的提升。 当下,语音行业云集巨头和大量创业者们。但对很多创业公司来说,技术突破或许难度不大,但对用户场景的理解以及围绕产品的生态建设则非常困难,这也就不难解释为何目前整个语音行业成为巨头——亚马逊、阿里云争夺的主战场。 在初敏博士看来,语音交互已经具备了相对多的应用场景,比如汽车,司机驾车过程中,语音交互是一种天然而又高效的交互模式;再比如智能家居,客厅里的音箱、电视,卧室里空调、厨房里的冰箱等等。不同的场景,用户的需求也有不同,汽车需要的是地图、导航、音乐,客厅需要的视频和音乐,厨房则需要超市和电商服务。 进一步来看,B 端的场景里,用语音操作工业机器人或者将语音交互用于服务型机器人(虚拟和实体)当中,这里的想象力也非常非常大。比如在阿里电商平台上的「阿里小蜜」,每天应对淘宝、天猫等交易平台上百万级服务量的情况,永远在线、全年无休,平均响应时间不到一秒,智能解决率也已超90%。这也意味着,在完全无需人工介入的情况下,通过语义分析和联想计算,「阿里小蜜」能向用户提供有效、对口的服务解决方案。 4. 写在最后 不管所谓「移动互联网下半场」的论调是否有依据,有个事实已经很明显了,自 2007 年开始的移动互联网行业已经步入一个全新的阶段,这其中最大的变化就是入口的变化。从曾经的搜索到后来的 App 再到如今的社交消息应用,而在用户交互层面,从键盘到触摸屏再到语音。在海量设备被联网后,移动互联网、物联网也将逐步融合、进化。 在谈及对 2017 年的预测时,初敏博士提出了两点:其一,自然语言理解技术的研发进展或许将过滤掉很大一批从业者;其二,随着智能语音交互设备出货量的增加,一个关键的窗口期即将到来。 (责任编辑:本港台直播) |