智东西创课前言 这是智东西创课第24期课程实录,分为主讲+问答二部分。主讲嘉宾是王砚峰,搜狗公司桌面事业部高级总监,桌面研究部和语音交互技术中心负责人。读完近万字全文,你可以掌握到: -智能语音在车内,客厅内,以及可穿戴三个场景会快速规模化应用,但如何做呢? -为何语音交互没有在智能手机上快速普及? -为什么聊天机器人不停地被大家遗弃? -如何看待亚马逊echo、google home的切入点以及前景呢? -Mor、三角兽等自然语义处理引擎初创公司的前景几何? -基于语音识别的智能客服产品如何市场化? -三五年后语音识别市场会形成什么格局? -搜狗在智能语音行业应用成功案例。 主讲环节实录 大家好,我08年进入互联网行业,之前在搜狗负责输入法后端的研发,然后又支持了多个搜狗号码通,手机助手,浏览器等用户产品,所以我是一个彻头彻尾的互联网从业者,今天会站在互联网公司的角度谈谈我的观点。从2012年开始,搜狗开始做自己的语音识别引擎。智能语音这两年成为了一个热点产业,吸引了国内外广大公司以及投资者的关注。同时这方面吸引眼球的新产品层出不穷,巨头们也在不停地布局。因此今天我不讲具体的技术或者产品,而是站在产业以及市场的角度给大家做一些不成体系的分享。为了具有一些针对性,我拜托智东西的同事们收集了一些大家普遍关注的问题,针对这些问题做一些具体的解读,把我个人包括搜狗公司的观点带进去。希望大家可以从我的片言只句中,看到我们背后的思考以及逻辑,甚至是技术观产品观和价值观,给大家带来一点点的启发。 所谓智能语音其实就是给语音加了大脑,能够理解用户通过语音表达出来的意图和需求,并且可以把对应的内容返回给用户。所以已经不仅仅是语音本身的范畴了,而是结合了自然语音理解,搜索等多种技术,最后通过语音的形式表达出来。一个典型的例子就是siri的语音助手。在这里面强调的是一种自然交互的方式,越自然越智能。在siri之前也会有一些语音交互的研究以及产品,但是都是单纯的基于命令菜单式的,这都不能算是智能语音。 语音市场的规模,引用一下工信部以及语音产业联盟的数据。自己没有做过太多细节的考证,贴出来给大家参考一下。根据中国工业和信息化部电子科技信息情报研究所数据显示,2013年,全球智能语音产业规模整体达33.7亿美元,同比增长38.1%;2014年较2013年同比增长41.0%;2015年较2014年同比增长35.7%。预计2016年语音产业规模可达82.3亿美元以上,到2017年,全球智能语音产业规模将达112.4亿美元,复合年均增长率达35.1%。 智能语音作为入口这件事情实际上已经发生了,比如在目前车内的后装导航,出货有很大一部分比例都是智能导航,通过语音来进行交互。尽管用户体验以及效果还存在一些问题,但是已经具有一定的可用程度了。 但是什么时候能爆发,还是要取决于: 第一,车联网以及智能家居等产业的进一步成熟,能给用户带来真正的价值,让用户在这些产品上产生切实的消费,而不是玩一下就扔。这样产业和产品的需求就会进一步倒逼技术的进步。 第二,语音的鲁棒性的问题需要进一步的解决,比如远场,噪声,多说话人等问题。当然这个过程是一个渐进式的。 第三,自然语言的理解能力也要有更大的提升,机器更加懂得用户的意图,才能给用户带来更加稳定的体验,产品才真正的可用。 所以爆发不仅仅简单是技术层面的事情,而是从产品设计到技术能力,atv,都要比现在有一个更好的提升。 语音交互目前在手机端比起文字交互来讲,确实算不上普及。比如目前每天会使用语音输入的用户占到8-10%左右,这仅仅是UV比例,如果是PV比例那就更低。另外从前阵子老罗在锤子发布会上给讯飞做了一把宣传以后,当时讯飞语音输入着实火了一阵,这也说一般用户对于语音功能的认知是远远不够的。惊奇于当前语音输入能有这么流畅的效果,说明大家的印象还是停留在久远的过去。那手机上目前认知度和普及程度还不够的原因主要都有什么呢? (责任编辑:本港台直播) |