Google Home也有了数百万的销量,苹果和微软也在研发他们自己的设备。这些努力的最终回报是有机会可以占领或至少可以影响三个重要的市场:家庭自动化、家庭娱乐和购物。 虽然可能没有太多人愿意和他们的冰箱交谈,但不可否认的是,生活方式在发生巨大改变。正如同智能手机改变了生活的方方面面,语音人工智能设备也在变革着我们的居家生活。为什么需要从床上爬起来去锁门,或者是在大冷天还要去手动开启车上的暖风呢?Alexa或是它的“亲戚”们就能帮你做这些事了。 当话语遇见AI 基于语音的人工智能技术之所以如此吸引消费者,是因为它满足了人类的要求:它按照人类的交流方式进行交流和思考,而使我们不再需要在键盘或屏幕上打字。 但这样的技术同时也很难打造。人类在说话时完全不考虑规律性。相反,我们打断自己的话。我们的思维时常反反复复。我们还常常莫名其妙地说出一些只言片语,有时点头有时摇头,甚至有时支支吾吾说不出话。对于人类,有时明明是在胡说八道,我们仍相信自己说的话有道理。 数千名亚马逊员工正在努力应对这一挑战,这包括在其位于西雅图、加州森尼维尔和马萨诸塞州剑桥等地研究中心的研究人员们。即便如此,亚马逊最近还在为1100个分布在各个部门的、和Alexa相关的工作岗位进行招聘,其中包括215个机器学习专家职位。在公司位于剑桥的办公室召开的一次会议上,经过询问Alexa的首席科学家Rohit Prasad关于为什么他需要这么多的人,以及他的研究团队何时才能完全建成等问题。Prasad回答说:“你的问题在我听来简直太好笑了。我已经从事了20年的语音技术研究工作,绝大多数时候,我们取得进展的速度都非常缓慢。然而,在过去的五年里出现了很多难逢的良机。” 发明一个真正奏效的语音激活式人工智能系统是一个非常复杂且尚未被攻克的难题。在过去,开奖,语言科学家们在试图一次性确定杂乱语句的具体含义时遇到了困难。而现在,新的机器学习方法另觅蹊径,以期待能解决这一问题:他们在一开始时就着手处理那些不完美的词语搭配,继而通过临时性的猜测快速调整这些搭配。 随着Alexa的使用量激增,亚马逊现在拥有了一个巨大的人机对话数据库——这让它在改进语音技术方面拥有了一定的优势,而谷歌长期以来一直凭借其文本搜索查询获得的数据进行这样的改进。外部数据也是有帮助的:例如,2016年一个庞大的歌词数据库被载入了Alexa中,这可以帮助确保当客户提出想听“drove my Chevy to the levee” (歌曲《American Pie》中的歌词)时,系统可以自动播放歌手Don McLean的名曲《American Pie》。 Prasad团队的一个最新项目凸显了这一方法的灵活性。这一项目致力于破解用户在何时会重新提及他们之前提过的要求。提示方式可能千差万别:有些人常说“不,不,不”,但另一些人偏向于使用“停止那个”,也有人喜欢尝试不同的表达,比如“等一下,实际上,我是想这么做”。但Alexa不需要解码所有的话语。大规模的样本数据和半监督式机器学习使系统能够勾画出一组可能的否定性语言标记,之后它可以在这些表达出现变化时,atv,从这组标记中找到一个易于理解的新的请求方式。 除了将Alexa打造成一个更好的听众之外,亚马逊的人工智能专家还在使用大量的数据来让它成为一个更好的演讲者,对机器合成女声的话语节奏进行调整,以使其可以更好地被使用。传统的语音合成依靠的是将众多被记录下的人类语言片段进行融合。虽然这种技术可以产生一种相当自然的声音,但它并不能表达窃窃私语、讽刺或其他类型的话语模式,而这些模式在人类交谈中会被使用到。为了继续加强Alexa对于从活泼的对话到深沉的朗诵等不同类型话语的把控能力,亚马逊的机器学习算法采取了不同以往的方法去训练Alexa,使其能够掌握或急切或焦虑等听起来很逼真的声音,那听起来就像是专业的播音员发出的。 据悉,亚马逊拥有自己的有声读物出版机构Audible,这对这项研究有所帮助。 如何帮助更多人 (责任编辑:本港台直播) |