产品对技术的要求总是高度综合的,这点在语音交互上体现的特别明显,当语音识别、自然语言理解需要产品化的时候,你并不能约束用户必须把电视关了、其它人不能说话、说话的时候必须正面产品90度、必须把音箱音量设置到足够小等等。那样产品就没法用了。也就是说真想做好产品还要打穿原子( 硬件)和比特(算法)的边界,补全整个链条,把声学、语音识别、语义理解进行系统的整合。 形象来讲就是在做Echo的时候,整个技术链条上国内企业自己要做的事情要远比做手机的时候多。硬件上是这样,算法上也是这样。 从前端到后端 Echo所代表的远不止是音箱升级,一旦前端产品成功,其后端价值就会大到任何人都无法忽视的程度。这点从行动上看国外巨头已经形成共识,而在国内大家思考的还不多,所以下面做些展开: 我们先做个基本的假设,那就是Alexa获得了巨大成功( Echo、智能音箱、Alexa有关联,但其实是不同的东西,这点在之前文章中有说,这里不再重复),渗透到各种设备之中,包围了人们的生活,人们有50%的时间在通过语音和设备打交道,并且日活逼近Android。 那这时候一定会衍生这样的需求,用户会说:Alexa,帮我通知下马化腾,明天我不见他了。这时候就需要有一种通讯的IM来实现这种需求。这时候亚马逊就有两个选择:第一它接入一种已有IM,比如Whatsapp,或者Skype。第二种是自己做一个嵌在Alexa里面。亚马逊至少有一半的几率会选择后者,而不是把这种基础设施开放给别人,因为前两种要么属于Facebook,atv,要么属于微软。如果在中国是阿里巴巴做成了Alexa,那估计百分百不会选择对接微信。这样一来配合一个语音交互的核心特征,颠覆性的事情就出现了: 语音交互背后隐藏的各种应用具有唯一性。 我们很难想象这样一种语音交互方式:Alexa帮我用Whatsapp给XXX留个消息,明天我不见他了。在语音交互中WhatsApp这类应用的标识很可能会被优化掉。如果Alexa还只是百万级、千万级DAU的应用时那这个特性还不关键,但如果它是10亿DAU的系统,那这个特性的影响就会被无限放大,也就说搜索、IM、电商很可能都只有一家,而不是像现在虽然少,但还有个1,2,3名。 小结 看着不过是又一款新产品,但Smart Speaker这新品类事实上整体上挑战中国企业的文化、方法论和技术水平。形象点讲,如果以Elon Musk做SpaceX的姿态来做,那这事是能搞定的,但以做脑白金的姿态来做,那最多还是一个叮咚。谁有这个决心和能力来搞定这事呢? 订阅号:琢磨事(zuomoshi) (责任编辑:本港台直播) |