音箱不是一款简单的硬件产品,背后的学问可大着呢。要提供给用户好的体验,能植入什么样的内容和服务非常关键,音乐库、音频节目(如喜马拉雅、得到)的丰富程度直接影响着用户的选择余地。然后就是能够根据用户的需求调用各种应用服务,但是目前国内各厂商还是只能集成自己生态里的服务,对于跨平台的内容集成得少,造成用户体验上的缺憾。还有就是渠道因素,叮咚、天猫精灵分别背靠京东和阿里电商的优势打开销售通路。巨头们出于战略考虑在抢占入口,基本都是赔本赚吆喝,整个行业利润空间拉得非常低,所以奉劝那些盲目跟风的小公司,还是别瞎掺和啦!巨头们布局的是生态,小公司耗不起啊!纯靠卖硬件很难有正向现金流,生存会非常难。 5. 技术难点 音箱产品看似简单,实际上还是有很多技术问题没有解决。在语音信息接收上,与手机、可穿戴设备不同的是,音箱是一个远场识别的场景,在家庭环境中要实现360°拾音和至少5~8米的交互距离,必须通过麦克风阵列来解决。还有就是语音唤醒率,主人叫它很多声都没有应答,或者主人没叫的时候它自己跳出来了,这都会让主人非常无奈有木有?当然还有更高级些的要求,比如它在播放歌曲和新闻的时候,主人突然打断,它能不能及时反应,再比如家里有好几个人同时说话的时候,或者主人在看电视的时候,它能不能在嘈杂的环境中准确地识别主人给它的指令?这些都和过硬的拾音、降噪、语音增强、声纹识别等技术是分不开的。 最难攻克的还是语义理解的部分,识别每一个字容易,听懂一段话背后的涵义却很难。我们在与他人的交流中,有时都很难去揣摩和理解他人的意图,更何况是机器呢?深度学习算法虽然大幅提高了语音识别率,但是在语义理解上还无能为力,语义理解还是要回归语言模型、传统机器学习算法和知识图谱相结合的路线中去。目前的语义理解只能在封闭场景中限定领域内去探索,但家庭环境中属于开放域,用户的需求多种多样,一个指令来了,音箱必须先判断属于哪一类问题,再考虑调用哪一类服务去满足。搜索引擎发展了这么多年,当你输入一个问题的时候,它也只能是把和问题相关的所有结果都罗列出来,能做的是相关度排序,但是做不到一对一的匹配。而音箱收到一个指令就要对应一个执行,收到一个问题就要对应一个答案,这确实是非常难的。 结语 智能音箱虽然不能马上在中国火起来,但它还是带来了很多好处。国内手机和无人机的产业能起来,atv直播,源于供应链的成熟,而智能音箱属于物联网的初级产品,将音箱智能化的操作系统、语音芯片等配套基础还不完善,如今众多玩家入局,推动了整个产业的发展。与此同时也起到了教育市场的作用,培养用户使用语音交互的习惯,为未来万物互联时代的到来做好铺垫。还有很重要的一点是可以推动技术的进步,语音技术的发展有赖于语料库的完善,而国内对语音数据的积累还比较薄弱,通过这些智能终端产品收集语音信息可以促进技术的成熟。所以没事的时候多撩撩语音助手,就算为技术发展做贡献啦~ (责任编辑:本港台直播) |