他们团队如何进一步推进机器阅读任务?这是一句深入的描述,「他们正在研发一种能够阅读文章并构思问题的系统,而不只是回答。该研究受启发于 20 世纪 80 年代的一个研究,研究表明在答题测试中,学生被要求写下关于一个主题的问题时会做的更好。」 Suleman 说:「有趣的是,生成问题时(而非回答)你真的需要更深入地理解文本。」
从左开始,依次是 Muluuba 联合创始人 Kaheer Suleman 和 Sam Pasupalak 搜索引擎的终结 机器阅读如此诱人是因为它对许多人都有很大帮助。 例如,高效的机器阅读系统能够推进搜索引擎的工作。相比于敲打词条,然后获得一堆链接,先进的机器阅读系统能像一个知识渊博的人回答问题一样给出解答。 高说,「它以自然的方式传递信息。」 大部分搜索引擎只能做基础的词条搜索,而且不是人们期待的那种要复制所有的信息。 机器阅读系统也能帮助医生、律师以及其他专家更快地阅读专业的医学或判例文档,从而让他们有更多的时间对病人进行治疗或构思合法抗辩。 它也能帮助人们更快地发现隐藏在汽车使用说明书或税务条例中的信息,节约时间。 高说:「世界中有大量信息,尤其是互联网中;为了让信息产生价值,需要将其转化为知识,而机器阅读技术可以在信息与知识之间搭建一个桥梁。」 数十年的研究以及最新进展 微软机器阅读工作的根基可以追溯到大约 20 年之前研究者在自然语言处理领域所做的早期工作。那时,微软的自然语言处理方面的首席研究员 Bill Dolan 开玩笑说,系统的工作只是偶尔很完美。 尽管如此,这一基础性工作正在被整合进算法之中,雷德蒙团队正是借助这一算法取得了当前机器阅读的绝大多数进展;该算法还是 Dolan 及其团队在自然语言处理方面取得的其他突破性成果的基础。 正如过去几年出现的人工智能进展,机器阅读也从更好的深度学习算法、大幅提升的云计算能力和海量数据中大受脾益。 研究者说这些能力,连同深度学习方法在图像和语音识别领域的进步,已经使他们自信地感觉到机器阅读的重大突破尽在眼前。这正是许多人依然惊奇的事情。 微软亚洲研究院自然语言计算研究组主管研究员韦福如说:「这对于从事自然语言处理甚至是人工智能的研究者来说是一个长期的梦想。」 尽管如此,研究者警惕说,为了创造出可以同时在语言及其细微差别方面真正理解人类诉求的系统,仍然有大量工作要做。 通常来讲,人工智能系统仍然只擅长处理特殊任务,它们也许能够找到问题的正确答案,精确识别出狗的品种或者人类的情绪状态,甚至理解会话中的词语;但是,研究者指出,这并不意味着它们能够以人类一出生就具有的方式理解信息,注意到所有的细微差别和语境。 韦福如指出,即使机器阅读团队的系统可以在 SQuAD 数据集中和人表现的一样好,但并不意味着机器可以像人一样真正阅读和理解,这是未来必须要面临的一个挑战。 周说:「这只是通向自然语言理解巨大挑战的一小步。」 你也许还想看: 感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:[email protected]。微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。 ,atv直播,直播 (责任编辑:本港台直播) |