Rangan Majumder、Yi‐Min Wang 和高剑锋(自左至右)在微软雷德蒙研究院。 微软机器阅读工作可以追溯到大约20年前研究者在自然语言处理领域所做的早期工作。随着过去几年人工智能的发展,机器阅读也从更好的深度学习算法、大幅提升的云计算能力和海量数据中大受脾益。微软在SQuAD(Stanford Question Answering Dataset)文本理解挑战赛,这一机器阅读领域的核心基准上的成绩一直稳居榜首。尽管如此,为了创造出可以同时在语言及其细微差别方面真正理解人类诉求的系统,仍然有大量工作要做。(本文转载自机器之心,译自Microsoft is teaching systems to read, answer and even ask questionsRead more 请点击文末阅读原文或者直接将网址复制至浏览器中打开即可查看 https://blogs.microsoft.com/next/2017/05/04/microsoft-is-teaching-systems-to-read-answer-and-even-ask-questions/#rhuyYf27jpBWLlZx.99) 微软的研究员目前已经创造出了能够像人类一样完成两种困难任务的技术:图像识别和语音识别。现在微软的顶级人工智能专家正在研究能够完成更复杂任务的系统:阅读文本进而回答问题。 Maluuba 的联合创始人 Kaheer Suleman 说到,「我们正在尝试开发一种文献机器:它能阅读、理解文本,然后学习如何交流,无论是笔录还是口述。」微软在今年年初时收购了这家创业公司。 机器阅读系统也能帮助医生、律师和其他专家更快地完成文档阅读这样的苦差事,从而让专家们有更多的时间治疗病人或构想合法抗辩。 Maluuba 团队是微软几个解决机器阅读难题的团队之一。其他两个团队,一个在华盛顿雷德蒙,一个在北京的研究院。这两个团队在斯坦福大学的 SQuAD 数据集上正在展开竞争,使用 Wikipedia 上的信息测试人工智能系统回答问题的能力。
在 SQuAD 数据集上的排名 SQuAD 数据集是机器阅读这一新兴领域的核心基准,许多顶尖的学术或产业团队都在使用它测试自己的系统。它类似于 ImageNet 竞赛,激励着计算机视觉的发展。此外,微软研究员和其他来自学界、产业界的团队也在使用另一个数据集 MS MARCO 进行激烈竞争,MS MARCO 数据集使用来自 Bing 搜索词条的真实、匿名数据来测试系统回答问题的能力。 团队成员说这是一个有附加值的挑战,因为它是基于人类的真实问题。在这种数据上测试能保证建立的系统最终对客户有用。 微软 Bing 部门合作伙伴组的一位项目经理 Rangan Majumder 说:「我们不只要奖励一堆算法解决理论问题,我们也要使用它们解决真实问题,在真实数据上进行测试。」他与雷德蒙机器阅读研究团队有密切的合作,并领导开发了 MS MARCO 数据集。
前排左二的韦福如、前排中间周明、以及微软亚洲研究院自然语言计算研究团队的成员 认知 VS 感知 总体而言,人工智能专家认为机器阅读要比图像识别这样的人工智能任务更困难,因为中间有太多模糊不清的地方。 微软亚洲研究院副院长周明博士表示,图像识别这样的技能是感知型任务:基于系统之前见过的图像,使用机器学习算法进行识别。目前,周明博士带领着微软亚洲研究院的自然语言研究组。 机器阅读是更复杂的认知型任务:它需要系统有大局观,查看它所读取文字的语境,甚至需要加入自身已有的关于这个主题的背景知识。 周说:「一些词可能有不同的含义,而相同的事情可能用不同的方式提及。」 另一个复杂性在于:给出的回答可能不包含问题中的词汇,甚至可能一个都没有。 例如,让我们假设有人问,「John Smith 的国籍是?」答案可能是,「John Smith 生于美国」,或者「他有美国护照」。在任何情况下,系统需要寻找、使用关联国籍的信息,但可能不会明确的说国籍这个词。 微软深度学习技术中心的高剑锋表示:「它需要生成一个答案,而且该答案与已有的都不同。」 Maluuba 的联合创始人 Suleman 提到,这正是人们如何测试其他人学习内容的方式。问问题,从小就开始问,并贯穿一生。 (责任编辑:本港台直播) |