如今的Amazon Alexa是一个庞大的系统:软件端有7000多个第三方语音Skill应用,硬件端嵌入了Alexa的产品几乎覆盖了智能生活的每一个方面。 可早在2015年,Alexa Skill Kit刚开放,Skill Store只有10来个技能,Alexa自己也只能完成为数不多的任务,例如:简单问答,播放音乐,读电子书,设置闹钟,设置提醒,遥控一两款智能灯和智能开关。总之就是比Siri能做的事情少,又没有Google那么能聊。 可是用户对Echo的评论却出乎意料地好。用户们并不在意Alexa的陪聊能力到底有多高,他们的期望很简单:我不用走到你跟前,给你个简单指令,你照做。
Echo很好地达到了这个期望值。首先,它是一个音箱而不是“机器人”,用户理所当然地明白它要能播放音乐。有了这些,Echo作为音箱算是及格,用户的反馈也就相对积极,再接上实用的读电子书和控制智能家居功能,就已经超越用户预期了。 反观在“人工智能”被过度宣传的这几年,不少产品过度哄抬了自己的能力,导致用户期望值过高,最终连及格也达不到。想想那些年我们调戏过的Siri,似乎可以做很多事情的样子,可是除了被调戏,有多少人能准确说出它还能干些啥? 一定要有功能性,满足刚需 那么,如何打造一款中国的Alexa? 我们采访了蓦然认知的CEO 戴帅湘。
戴帅湘是前百度主任架构师,曾长期担任百度Query理解方向负责人,曾荣获百度语义技术的最高奖。他在2010年提出“Query改写模型”方案,提升了百度引擎的搜索相关技术,带来大幅广告收益;他拥有20多项专利技术,分布在自然语言处理、语义搜索、自动问题求解等多个领域。 在to C的智能音箱产品上中国市场已经撕的不可开交,而to B这一块,语音产品广泛的应用前景。戴帅湘认为切入to B领域,通过语音服务来满足用户的痛点是一片蓝海。 智能语音服务能够满足的刚需 对于语音产品,我们非常看好以下场景: 智能硬件:非常看好传统硬件的品类升级,比如智能耳机和智能音箱。又比如笔记本和电视上加上语音功能,可以想象的一个场景是,通过遥控器来控制电视机来选电视栏目或者电影效率远远低于直接语音输入。 智能安防:简单的说,可以给所有的摄像头加上麦克风阵列,增加语音模块。 智能医疗:语音在这个领域有诸多应用,j2直播,一个例子是电子病历,简单的说就是医生在诊断过程中语音输入便可以直接形成病历。另外一个例子是医学检测有些是通过声音检测来完成,那么直接加上语音模块既能完成交互又可以检测,可以淘汰掉屏幕等交互方式。 教育:可以将麦克风阵列应用于多媒体教室,另外一个应用领域则是远程家教。 智能玩具:具有语音交互功能的玩具更吸引孩子们的注意,但是考虑到玩具成本以及孩子的习惯,单麦识别算法是当前比较适合的方案,例如360儿童机器人,360故事机等 汽车市场:在手和眼镜都被占据(no hands no eyes)条件下,语音是个最好的交互方式,汽车上的语音产品是兵家必争之地。 语音将成为下一代智能设备重要的交互方式是一个确定的事情,随着行业的进步,更优质的语音产品将会更低成本进入生活方方面面,为我们的生活和工作带来更多便利。 蓦然认知在上述领域已早有布局,比如最近蓦然宣布和暴风合作推出对话交互电视X5ECHO。戴帅湘表示,除智能电视代表的智能家居之外,蓦然认知还在布局智能车载、智能客服等领域,目前展现在暴风TV上的功能只是冰山一角,智能交互决策引擎Mor 还在继续开发和不断优化中。 (蓦然认知AI对话交互 TV原型系统演示) 智能语音服务需要解决的技术难点 那么要满足这些需求,蓦然认知的CEO 戴帅湘表示一个智能语音服务需要克服三大技术难点: (责任编辑:本港台直播) |