从技术上讲,语音在开放场景下还不够准。比如方言的问题,噪声的问题,尤其是其他说话人带来的噪声目前仍然是致命的。所以语音对于用户来讲,识别结果不是完全可以预期。一旦错了修改的成本还是很高的,所以很多用户宁可打字。因为文字输入的结果是稳定的可预期的,这种可预期本身就会带给用户安全感。因此绝大部分用户是为稳定而买单,只有一部分用户会为酷炫和高效买单。但是大家也看到这个趋势,就是用户在手机上使用语音的比例在不断提升,这也是技术不断提升的一个结果。当然从另外一个角度,当前手机上的语音主要还是聚焦在输入法,以及语音搜索上。设想一下用户在搜索场景下,如果他这个时候方便打字,只需要在地图APP上打一个地名,效率本身也并不定(地图APP往往都有suggestion的能力),这样用户也不会冒着语音错误的风险去用语音的输入。换言之就是大部分用户的输入量都不够大,键盘也已经用的很纯熟,搜狗输入法的键盘还具有智能纠错功能,这就使得大部分用户对于输入效率的痛点不够,也没有进一步的动力去冒风险尝试更有效率的输入方式。实际上从当前用户反馈中,愿意使用语音的用户,尤其是重度用户,都是以文字工作者为主,包括我们的记者朋友们。他们就是愿意为了效率去冒一些不确定性的风险,但是从效率上的收益是巨大的,足够形成动力的。因此最终目前手机上语音输入的场景分成两类:一种是用户当前确实不方便打字,会选择使用语音。另一方面我们看到年轻人会更加喜欢用语音的方式进行输入,觉得这种行为更具有style,更好玩儿。重度文字工作者在所有用户中更是只占一小部分比例。 哪些语音交互场景最具增长潜力,以及能快速规模化应用?三个有价值的场景,目前大家已经很有共识了。那就是车内,客厅内,以及可穿戴。引用一下今年互联网女皇在她报告中提到的,美国同学们使用语音的主要原因和场景: 不过这几个场景爆发的顺序有先后。我认为是先是车,然后是智能家居,然后是可穿戴。车的场景最明确,需求也最明确,产品定位也最明确,所以语音的目标也最明确,从产业步伐上来看,目前车内导航语音普及率也是最高的。智能家居目前围绕电视和音响,具体的需求就是搜片和听歌(以及FM等),加上echo的带动,这方面的需求也比较明确。但是目前有些过热,比如一个以听歌为主要产品场景的音箱,已经被大家定位成了未来家庭智能的入口。可目前产品本身做得不够好,所以其实用户消费还是比较惨淡。不过长期的价值我是看好的,只要大家产品观正确,先打造一个好产品,再考虑入口的事情,最终还是能够有一个更高的普及率。可穿戴我认为是最晚的,因为市场上产品还没有成为刚需,比如智能手表,给用户带来的价值,其实是远小于我们内心中的预期的。语音的价值更不可能在产品就产生价值之前呈现出来。 说下聊天机器人。因为我们的谈的是“智能语音”。智能这个概念,最好的体现就是让设备像人一样具有感情,越具有感情越觉得智能。也是因为这个认知,把大家导向到了这样一条不归路上。瓶颈目前其实很明显,那就是技术问题目前导致机器本质上来讲没法达到人的地步,一个心智上没有问题的成年人,一定不会长期使用的,可能就是最开始用着新鲜体验一下。给一张我在外面常用的图来解释一下: 这是我认为一个好产品所具备的最基本要素。我们回到机器人这个产品上。当前的聊天机器人只是解决的产品金字塔最顶层的“有趣”的要素,但是更底层的“刚需”以及中间层的“稳定”都远远不足。这也是为什么聊天机器人不停地被大家遗弃的原因。为了不被人遗弃,我们的小冰MM只好每两周都升级一个新技能,让大家持续保持新鲜感。否则很容易7日之痒。 但是从产品价值本身来讲,其实小冰还是没有给用户带来真正的价值的。所以如果不继续升级来刺激大家,很容易就被抛弃。聊天机器人未来的突破口可以放在儿童方面,因为儿童的心智本身就是非理性以及跳跃的,并且重复的东西儿童也会喜欢,所以儿童是可以持续和机器人去玩儿。能结合聊天机器人做一个好的玩具,那对于儿童来讲还是具有不错的用户价值。 (责任编辑:本港台直播) |