【CES ASIA 2017】老牌音响厂商哈曼发布 SONIQUE,一个完美解决 Alexa 们在语音识别上的声场方案 来源:动点科技 原标题:【CES ASIA 2017】老牌音响厂商哈曼发布 SONIQUE,一个完美解决 Alexa 们在语音识别上的声场方案
不久前,笔者曾提到过一个 Pizza 广告引发的智能家电入侵用户隐私担忧的事例(不记得的朋友可 传送门温习一个)。之所以会出现类似的事件主要还是起源于语音识别技术的不完善,如果传统音箱厂商能够加入到人机交互解决策略的这支队伍中来,无疑在很大程度上可以把自身在该领域的积淀优势最大化,给现阶段智能音箱的“木桶理论”比如远距离识别,针对性辨识声音的技术缺陷锦上添花。 前几年,语音交互应用最为普遍的就是以 Siri 为代表的智能手机,这个场景一般都是采用单麦克风系统。若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,会导致拾取信号的质量下降,严重影响语音识别率。而且很难实现各个声源的分离。在语音识别中很重要的就是要抑制人声的干扰,语音识别显然不能同时识别两个以上的声音。所以像是亚马逊的 Echo 等都采用了一种麦克风阵列技术,即由一定数目的声学传感器组成,用来对声场的空间特性进行采样和并处理;但硬件到位了,背后的系统还不是非常成熟,所以才会有了汉堡王广告门的一幕。 在 CES Asia 2017 展会上,atv,著名音响设备厂商 Harman(哈曼)就悄悄发布了全新的远程语音识别解决方案 SONIQUE。该解决方案主要是软硬结合——一套可定制化的高性能麦克风阵列以及一系列可在高噪音环境下精确捕捉语音指令的音效算法。最为关键的是,还配置了哈曼自主研发的低失真喇叭,并支持市面所有主流语音引擎。 Harman 的工作人员告诉我们,根据特定的用户需求, SONIQUE 可提供三种不同的解决方案。第一种名为双麦语音解决方案,主要面向以家用电子为主的消费类电子应用,可以灵活应用于消费类音响,电视机顶盒以及网络路由器等设备,双麦配置可支持最远 4 米的高清远距离拾音需求。第二种配置为四麦语音解决方案,主要面向高端家用电子产品、企业级应用以及机器人,可支持最远 6 米的高清远距离拾音需求。第三种为七麦语音解决方案,主要面向对性能要求高的企业级应用和机器人,通过搭配系列音效算法,七麦语音解决方案可支持最远 8 米的高清远距离拾音需求。 通俗一点得说就是——Harman 的这套方案能让客户可以根据自己的需求,选择双麦(范围 4 米,可配合开关类产品,成本低易安装)、四麦(范围 6 米,适合会议室)或七麦组合(范围最远 8 到 10 米,多是企业用途)。在这个基础上,配合回声、噪音消除算法、低失真扬声器和波束形成技术,就能达到 360 度全方位的远距离拾音了。Harman 在 CES Asia 2017 发布的宣传片中用一台七麦的 demo 机,准确识别了来自三个不同方向、最远间隔约有 10 米的语音指令。
值得一提的是,这台设备的麦克风和扬声器是通过磁点相连——也就是说,Harman 给设计留出的自由度不只体现在麦克风的个数上,扬声器的搭配也能做到很灵活,未来应该能看到更多不同于 Invoke 型态的产品问世。 SONIQUE 远程语音识别解决方案将开源支持主流语音引擎集成。这其中包括市面一众主流 AI 助手们,亚马逊 Alexa 以及微软 Cortana,官方还宣布预计在近期内与更多语音引擎厂商开展合作,包括:百度,科大讯飞,GoogleAssistant,直播, SoundHound, 以及苹果 Siri。此外,SONIQUE 还可与声控设备进行集成。现场所用的这台 demo 机是基于 Amazon Alexa,但它不是市售的商品,用途仅仅是示范而已,可能也是由于展会现场比较喧闹无法进行实际的体验有关。 这样高能的技术可不光是和一家合作,Harman 的工作人员还向动点科技介绍:使用 Google Assistant、Alexa、百度、科大讯飞等其它语音引擎,同时有 SONIQUE 加持的喇叭都在计划当中。未来它们应该会被归到 Harman 自己或其它子品牌名下推出,有远场识音和音质上的优势,哪怕跟原厂正牌比估计也会有不小的竞争力吧? (责任编辑:本港台直播) |