9 月 27 日,atv,由中国家电网和云知声联合举办的智能家电高端峰会在深圳召开。在会场外的展厅里,j2直播,一台抽油烟机吸引了很多人围观。人们纷纷对着智能吸油烟机说话,一旦说出 “你好小智”,吸油烟机就会被唤醒,自动开启。当你说出“调大风速”、“爆炒模式”这些词语时,抽油烟机就会根据语音命令,调换到相应模式。 对于大多数人来说,跟一台抽油烟机展开了“对话”,还是蛮新奇的体验。而这背后,都离不开云知声的 AI 芯系列产品。对于此,云知声 IoT 事业部总裁谢冠超接受了雷锋网(搜索“雷锋网”公众号关注)的采访。 第 2 代的AI 芯:语音唤醒和语义理解 云知声在智能家电领域的主打产品是 AI 芯,这个系列里最重要的是 IVM-M 和 IVM-W 这两款芯片。 目前 IVM-M 的典型应用包括家用空调、冰箱和音箱等,IVM-W 的典型应用包括商用空调、电饭煲和小家电。两款产品都支持在线和离线,都能实现语音唤醒,不同的厂商可以定制自己的“唤醒词”,比如前文所提到的智能抽油烟机的唤醒词是“你好小智”,另一款台灯的唤醒词就是“你好小巢”。纯粹的语音交互,使得智能家电脱离了手机 APP 的窠臼。 IVM-W 能够支持 30 条离线命令词,但是大部分的功能还是需要连接 WIFI 来实现。它主要是基于高通的 WIFI 模块,所以对于家电厂商来说,并没有增加额外的硬件成本。 而 IVM-M 相对来说,使用的是双麦克解决方案,会增加一定硬件成本,但是大部分功能可以离线完成,能够支持 400 条离线命令词。 离线情况下能实现大部分功能,这是很重要的。对于家电厂商来说,目前更倾向于使用离线,这是目前中国网络的普及程度和质量的大环境所决定的。 从 2015 年到现在,其实 IVM-M 已经经历了一次升级改造,第 2 代的 IVM-M 比第 1 代有着更高的识别准确率和更智能的“语义理解”。也就是说,虽然说明书上给了你 400 条离线命令词,用户其实不必一字一顿按照上面的文字来发布指令。 比如,家里有一个智能空调,在第 1 代产品的时候,用户得按照说明书上精准地说出“温度调低一度”,但是现在可以随意说“我太热了,调低一点”,空调能自动理解,调低一度温度。谢冠超表示,这种对“自然语义”的理解,在离线的情况下也可以完成。这使得智能家电产品更好地贴近了人的自然语言习惯。 AI 芯的主要竞争优势:低成本和双麦克 在谈及 AI 芯最主要的竞争优势时,谢冠超对雷锋网表示,一是成本,二是双麦克解决方案。 “AI 芯是在比较低的硬件成本上实现的,所以我们在成本上有很大的优势。”而谢冠超表示,目前国内市场上能提供双麦克解决方案的,只有云知声一家。 其实,对于做后端的云知声来说,当然麦克风越多越好。就像销量超过 300 万台的亚马逊 Echo,就有 7 个麦克风,围成一个圈。但是普通家电与亚马逊的 Echo 是不一样的,Echo 是自成一体的产品,它的功能很纯粹,就是为了语音交互;家电产品的外观设计主要还是为原有的功能服务。简单来说,就是家电“摆不下”那么多麦克风,这使得云知声要考虑更多的东西。 “麦克风多了,会带来两方面的问题。首先是成本,然而更严重的,是为家电厂商带来了结构上的问题”,谢冠超向雷锋网解释道,“因为不论是环形还是线性的产品,多个麦克风都需要完美等距的排布。但是现在大部分的家电产品是不规则的流线形乃至各种创新的形状,你不太能在上面找到一个完美的直线或圆形去放置多个麦克风。 ” 所以,云知声找到的解决方案是:只用 2 个麦克风,在这个基础之上就实现了 5 米的“远场识别“,达到了大部分的多麦克使用体验。而且这种解决方案,已经受到主流家电厂商的认可。 在被问及 AI 芯目前总的出货量有多少时,谢冠超透露,有“几十万的出货量”。而且,第 2 代产品才于今年 8 月份成熟和批量出货,相比于第 1 代产品,它有着更明显的性能和成本优势。 最大的挑战:没有既定标准、产品渗透率偏低 AI 芯的研发花了一年半的时间,这倒不是因为技术上有多困难,而是在于,云知声是“在解决一个边界不确定的问题”。 在语音交互领域,目前行业内并没有既定的检测标准。所以云知声不仅要做好自己产品的开发,还要和家电商们一起在用户体验和产品成本之间寻求平衡,找到一个行业共同认可的标准。 (责任编辑:本港台直播) |