本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】【深度】亚马逊Alexa称霸CES,语音计算平台仍面临这5大技术挑战(4)

时间:2017-01-17 03:29来源:报码现场 作者:118开奖 点击:
虽然 Alexa 在市场份额中独占鳌头,但是Siri,Alexa,Google Assistant,Cortana 到底哪个好用,哪个笨拙?!这要把它们放在一起真刀真枪地比试一下才会见分晓

  虽然 Alexa 在市场份额中独占鳌头,但是Siri,Alexa,Google Assistant,Cortana 到底哪个好用,哪个笨拙?!这要把它们放在一起真刀真枪地比试一下才会见分晓。

  为此,Business Insider 做了实验,测试者会就交通、邮件、发信息、社交、翻译、知识面、性格特征等方面提出一些问题或指令,然后评选出这一项中表现最优的产品。

  用了几轮下来,如果按每一项测试的积分叠加,Siri 应该是是冠军,但是测试者整体感受下来,还是比较倾向使用 Google Assistant。从技术上来说,Google Assistant是最流畅的,测试者不需要把一个问题重复多次,在很多实用场景下解决问题的能力也比较好,而 Siri 给人感觉更像是一个机器人。亚马逊 Alexa 最擅长的还是一个向设定闹钟和日历提醒这样的基本功能,而且它的“绝技”是网上购物和智能家居控制。Cortana 则更像是一个Bing的语音版。

  由此,亚马逊的 Alexa 虽然在年轻的智能家居市场似乎稳居第一,但是在智能语音技术方面上升的空间还有很多,因而被赶超的可能性大有所在。当然,以下测评发生在 2016 年的11月,各款助理现在或许都有改进。但究竟谁能登上下一代计算平台的霸主地位,目前还说不好。

  语音成为下一代计算平台还需解决的技术挑战

  一、自然语言理解

  去年,Facebook 的AI 研究室成立的时候,作为实验室主任的 Yann LeCun说:“对于深度学习来说,下一个大的进步在于自然语言理解(NLU),其目标的是让机器具备不仅是理解词语,而是整个剧组和段落的能力。

  并且,截止2016年6月,Loebner 大的金牌(通过图灵测试的奖励)也并没有颁出去。也许,现在的人机对话可以做到很好,拥有复杂的自然语言能力,许多的服务也以此为目标。但是,NLU 的实际发展情况究竟是什么,为什么会如此困难?

  语言很难建模(和编程),因为它过于模糊。类似的句子可能会有非常不同的含义,同时,看起来非常不同的句子又可能有相同的意思。人类的交流是非常奇怪、无规则、无意识和上下矛盾的,但是,这些问题都可以通过人类理解非完全的、模糊的沟通信息的能力进行弥补,这是基于语境的。通过自身经验,我们会无意识地建立起复杂的模型,来理解不同的情境下,某个词的具体含义是什么。并且还能把这些模型组合到一起。

  最近,许多围绕对话交互界面的突破都要追溯到自然语言处理的概念,这一技术近年来已经获得了足够充分的发展。

  因为我们不会有意识地以一种结构化的方式来理解语言,所以,用于从大规模的、非标签的数据中进行推理的新数据方法(比如,深度学习)看起来非常适用于自然语言理解。这些技术极大地提升了我们计算语言的能力,并且不需要具体地对语言的原理进行编。正如此前讨论到的,这得益于三个要素:更多的数据、更多的计算和更新、更好的算法。

  结果证明,即使深度学习技术是NLU上非常严肃的一个进展,我们的自然语言“难题”离最终的解决还有很远。不同的应用(问答、情感分析、机器翻译、部分语音标签)需要有不同的模型架构:强监督式记忆神经网络、树形长短记忆网络、双向LSTM限制随机域(CRF),动态记忆网络等等。

  即使我们在研究上有一些非常有潜力的新想法,设计、工程合成、可扩展的对话系统与这些想法的 结合依然处于非常复杂的状态,离商用还很远。人工智能的天才们都极端地聚焦在平台型的公司(因为那里有训练模型所需要的数据)。非盈利组织OpenAI已经开始行动,保证这些能力不要被垄断在这些以盈利为主要驱动力的互联网公司中。Open AI 最初宣布的四个目标中,有一个就是“打造拥有自然语言理解能力的代理”。

  二、音频识别

  语音受到几乎所有与发信息bots相同的技术问题,除了要求准确地转录。尽管最近在语言理解和语音合成方面取得了令人印象深刻的进展,但是创建引人注目的基于语音的体验仍然是一项艰巨的任务。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容