这得靠优化产品体验,陆奇在演讲中就总结,在百度人工智能的总体布局当中,最最关键的是场景落地,把用户体验做到极致,然后迅速迭代。 DuerOS在现场整个演示非常流畅,两位用户想必经过了一定的编排(既然是资深用户,也不排除姚晨和宋晨枫已经非常了解该怎么和小鱼对话),但还是能发现这个语音交互产品的需要改进的地方。 1、语音识别在现实环境中的准确率。景鲲表示,百度的语音识别在实验室环境下可以达到97%-99%的准确率,但现实场景中会有电视等噪音的干扰,目前还没有特别准确的测量方法,但总体来说还是很有挑战,百度的实验室也在模拟现实场景做优化。 2、第三方应用交互的语音化。目前,大多数拥有技能的第三方应用,还是以触摸的交互方式为主,这就意味着DuerOS的语音交互,很多时候只能止步在打开某一个应用这里。 在一个场景中,无法做到完全的语音交互,比如,在汽车场景中,司机希望听我氪的“氪星晚报”,如果36氪跟DuerOS合作,一说“我想听36氪的氪星晚报”,系统就可以直接打开36氪播放,如果没有合作,系统只能做到打开36氪,然后司机却需要手动找到“氪星晚报”。 只有百度将某个场景中最高频的“操作”语音化,大概才能说真正拿下了这个场景,也就是说,百度需要跟大量的第三方应用合作,以完成整个操作语音化。景鲲说会谈一些合作,但目前不能透露哦。 除了适配存量APP,直接让开发者开发语音原生APP也是一个路径,百度也有在跟一些开发者对接。 3、语音交互自然化的程度。现场姚晨和宋晨枫给的指令都非常清晰,但其实自然语言交互还有一个很明显的特征,就是非结构化,目前大量应用UI的设计逻辑,都是将自己拥有的功能和服务结构化,比如大众点评将店铺按照地区和类型。用户在用语音提需求的时候,不一定会一句话说“我想在中关村附近的金逸电影城看两点半那场《嫌疑人x的献身》”,而是可能要通过几次交互来完成的,甚至还会有各种奇葩需求。景鲲之前表示,会通过打标签来完善这个体验。 还有其他影响交互流畅度的设置。目前,用户每次每和这个机器人说一句话之前,都要说:“小鱼小鱼”(如果小鱼是个人估计会被烦死),实际上自然语言对话很少如此。景鲲表示,atv直播,其实这个需求百度也注意到,已经在着手解决;而且实际上人人对话,也是有“隐藏”的唤醒词,比如一个眼神,因此,拥有屏幕的小鱼在家,也拥有类似的“凝视唤醒”功能。 如今,DuerOS落地的场景不少,包括上面提到的电视、厨房、手机、家庭等,j2直播,甚至是未来的汽车,语音交互性质的硬件不断涌现,每个拥有一定场景的厂商,无论是音箱、手机、家庭机器人,甚至是冰箱,都希望自己成为控制中枢。每个都有属于自己的唤醒词,用户是不是也有点纠结,不过原来,所有搭载DuerOS平台,也都会有一个副唤醒词“小度小度”。可是却从来没有公布过...... 可见,这次的百度,甘愿做“在你成功背后”这样的角色,而不一定要有百度的品牌露出。在特定场景上,景鲲表示,还是会更了解合作伙伴的需求,根据痛点做定制,把能力给到合作伙伴(其实降低适配门槛也是百度在厂商这一端的策略,具体可以参考文章《百度进驻冰箱和音箱背后,是想成为AI时代安卓系统的图谋》);在用户端,则希望理解用户的需求,“让他们觉得这个东西有用,提高用户对类似产品的认可。 既然想做平台,让不同硬件厂商和消费者产生依赖,才能占领更多场景吧。趁阿里和腾讯等还没开始,百度动作要快。 (责任编辑:本港台直播) |