本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】【中信双创沙龙】搜狗陈伟:通用语音助手这条路,现在还行不通(2)

时间:2017-05-17 20:46来源:668论坛 作者:开奖直播现场 点击:
不过,仅仅这些技术还是不够的,“在家庭、车载等场景下交互,会出现多种噪声,比如在开车时面临的风噪,在大的房间里面有回声、回响,在这些条件

  不过,仅仅这些技术还是不够的,“在家庭、车载等场景下交互,会出现多种噪声,比如在开车时面临的风噪,在大的房间里面有回声、回响,在这些条件下,语音识别基本上不可用。”为此,在语音输入前要做降噪和增强处理,“这里的重点就在于,软件解决不了的问题需要硬件的方式来解决。”

  

wzatv:【j2开奖】【中信双创沙龙】搜狗陈伟:通用语音助手这条路,现在还行不通

  具体而言,搜狗推荐采用多麦克风阵列方案。“我们之前更多地在手机上使用单麦克风的方案,单路麦克风引入的噪声是很难分离的,而多麦克风阵列方案则可以很好地降低噪声,比如车载麦克风只对司机方向录音,在电视场景中,当在客厅里面有一个人说话的时候可以定位你在哪个位置,从而规避掉角度之外的声音,提升说话人语音识别的效果。”陈伟如此表示。

  另外,陈伟认为在相对不那么复杂的情况下语音识别可以做到 97%的准确率,但是离百分之百存在一定的鸿沟和差距。因此,“当出现错误后怎么通过产品的方式去弥补,这是我们目前搜狗的重要关注点之一。这就意味着语音纠错功能必不可少,比如人和人之间沟通的时候,在介绍说我叫章砚,会具体的说一下,立早章,砚台的砚。”陈伟介绍,“当有了这样语音纠错能力后,用户在出错后可以通过语音的方式进行纠正。我们在上线的时候修改成功率只能到 40%,但是随着产品不断迭代目前可以达到 80%的修改成功率。”

  最后,陈伟总结认为,产品跟技术相辅相成,因为技术永远有缺陷,当技术上出现了问题时,通过产品设计的方式去纠正和避开,也很关键。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容