本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【图】普强信息何国涛:瞄准语音大数据分析和车载,做语音识别就是要快、准和专注 | AI创新50(2)

时间:2017-04-26 04:14来源:香港现场开奖 作者:118开奖 点击:
李全忠博士向黑智 (VR-2014) 介绍,“千语语音识别引擎系统”开发应用了深度神经网络技术,通过语音切分技术和对识别结果的算法,进行语速探测、情

李全忠博士向黑智(VR-2014)介绍,“千语语音识别引擎系统”开发应用了深度神经网络技术,通过语音切分技术和对识别结果的算法,进行语速探测、情绪识别等,以及对讲话对象、时间边界等进行分割,不仅提高了语音识别结果,也可以辅助企业进一步挖掘和分析海量语音数据。

当坐席和客户通话时,接入了普强的千语千寻系统模型,不仅能将不同方言的来电转换成文字,还能根据不同的系统用户需求,标注出关键用词,并针对其进行统计和专业化分析,挖掘客户需求;对客户流失进行预警分析,挖掘客户投诉原因,进行干预;或者替代人工质检。何国涛举例说,例如某保险公司就有2万左右名保险销售,管理者需要知道如何提高销售成功率,客户投诉的是什么问题,客户购买保险服务的原因是什么等。“千寻”把这些问题都细化成文字,以解决客户的需求,提升公司工作效率和营销转化率。

进行语音大数据分析,最基本的一点就是数据。李全忠表示,普强在呼叫中心电话线领域积累了十多年的数据,对电话语音数据处理和标注的积累,在业内是首屈一指的。

而对语音分析,最关键的比拼点,则是“快”和“准”。“准确度和识别速度往往要平衡,在不损失精度的前提下,我们可以做到最快,系统的全文识别率可达85%以上,关键词识别率达95%以上。”李全忠博士说。他表示,千语千寻语音分析系统目前中文语音分析速度,是国内最快的。它拥有的文本分析引擎和索引处理技术,能够实现分析操作在秒级以内完成,而业内多数语音公司的产品则要半小时甚至更久,千语千寻比之,要高出一个数量级。

除识别引擎及分析系统外,与国内外厂商相比,普强的优势是拥有多年呼叫中心工作经验的专家们所组成的专业咨询团队,以及完整的识别设备和工具,来协助客户进行定制化应用服务,以保障企业最高的投资报酬率。

而据何国涛对黑智(VR-2014)透露,目前普强在业界公开招投标的项目中,始终保持着最高的中标率。

  联手四维图新,切入车载场景

经过十多年的发展,四维图新已成为国内数字地图内容、车联网和动态交通信息服务、基于位置的大数据垂直应用服务主要提供商之一。其数字地图一直主导中国前装车载导航市场,获得大量、东风日产、北京现代等主流车厂的订单。而和四维图新的联手,显然加快了普强切入车载场景,迅速渗透车厂和车机系统集成商,积累大数据的步伐。

2015年,普强联手四维图新和腾讯,共同开发智能车联网大数据系统 WeDrive。其中,四维负责导航,腾讯负责内容,普强主攻前装。

wzatv:【图】普强信息何国涛:瞄准语音大数据分析和车载,做语音识别就是要快、准和专注 | AI创新50

这套智能车载语音系统,是由“云+端+芯片”组成的。普强自主研发的是离线、在线的两个声学模型,其他的为集成。

阵列麦克风可抑制噪音回音,进行声源定位。车载降噪DSP芯片可进行车载降噪去回声,这也是普强的投资方——美国的一家芯片公司提供的。“他们只做芯片,花了大概一亿美金做了十年,这就是壁垒。”

“从前端麦克风技术,包括硬件的DSP处理三到四个麦克风,到后端的云端,整个一条脉络已经打通了,基本上这个解决方案是最优的。”李全忠说。

另外,atv直播,普强还可以做嵌入式识别,车机识别的系统直接在车机里面做,不用跑到云端。车载需要保证稳定性、安全性,对嵌入式识别压力非常大。普强会针对不同的系统和车机本身的噪音特性,分低中高端方案,量身定制识别算法。“把这些都优化进去,才能做到最佳,当然也要满足用户识别率的需求。”李全忠表示。

目前,普强车载语音系统已经被集成进多家国内主流车厂。普强最近也把嵌入式的算法嵌到四维收购的公司杰发科技,后者占后装市场的70%,大幅提高了市占率。

  用户需求优先的“田忌赛马”战术

在何国涛看来,“专注”还有另外一层含义,即要准确理解用户的需求。而对人工智能创业公司而言,算法并不是唯一,更重要的是,理解用户的产品需求。从产品、界面、工作流到用户层面的交互设计,都要围绕它进行。比如,对车载产品而言,车速变化时,会影响到语音识别的准确率;车开得快,根本不会出现车旁边有个人在走路的情况;车开得慢,就要小心旁边打球的小孩……

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容