Facebook近日宣布开源其AI对话研究平台 ParlAI ,集合了常见的20多个数据集,解决人机对话中最常见的5类问题。Fortune 报道称,Facebook的目标是让计算机与人类进行有意义的对话。如果取得成功,这将是目前技术上的一大进步。 对我们大多数人来说,沟通似乎是一个再简单不过的任务。 但实际并非如此。如果你是一个试图复制人类对话的机器,那么你需要善于处理很多任务,比如回答问题,完成句子,甚至还要能闲谈两句。这些领域的独立研究是很常见的,但这不利于将它们组合在一起,以创建一个会话式的 AI。 Facebook AI Reasearch(FAIR) 实验室的开源 ParlAI 作为对话研究的“基地”,使用各种常用数据集轻松地训练模型来完成多个任务,解决了这一缺陷。 使用 ParlAI 将数据集拉入工作流程像写下一行命令那样简单。 这使研究人员可以快速访问基准测试数据集,如 SQuAD, bAbI 任务和 WebQuestions。这并不是说 AI 研究社区以前无法完成这项工作,而是 FAIR 正在努力激励团队定期将更多的数据集带入他们的工作。ParlAI 还连接到 Amazon Mechanical Turk ,这样研究人员就可以无缝地收集新的数据。 FAIR 实验室的研究员 Jason Weston在接受采访时说,ParlAI 的一些灵感来自于观察研究人员在 WebQuestions 数据集中取得的进展,只有明确显示出过于专业、不适用于其他任务的数据才会被基本忽略掉。 AI 研究如影随形的挑战之一是,很难从表面上判断论文的价值。几乎每篇论文中,研究人员都会声称,他们提出的漂亮模型是最先进的。问题是,造成某个特定结果的因素如此之多,只有能重复再现的研究结果才有价值。 ParlAI 选取了一些可重复的研究,为 AI 社区灌输着更健康的理念。FAIR 团队希望在未来建立自己的排行榜,以推动整个生态的进步。 ParlAI 的形式与其他训练和测试解决方案类似,例如 OpenAI 的 Gym 和 DeepMind 的 Lab。 但是 Gym 和 Lab 被优化用于强化学习,ParlAI 则专注于对话研究。对话空间中的一些监督学习的基础性工作不如时髦的强化学习那么性感,但它对机器学习领域来说是非常重要的。 FAIR 计划在内部使用自己的 ParlAI 进行研究。Facebook 的许多服务植根于其在对话领域的研究工作,其中最明显的一个是“M”——Facebook 的“人类+AI”驱动助手 。最后,Weston 说, M 这样的服务可能会从与人的交谈和收到的反馈中学习,就像婴幼儿的学习方式一样。 但实现这一目标的唯一方法就是打破人造孤岛,结合正在进行的多项研究,来解决大规模问题。 您可以在 GitHub上找到 ParlAI ,FAIR 团队将对其进行持续维护。(开源地址) Fortune 报道称,Facebook的目标是让计算机与人类进行有意义的对话。如果取得成功,这将是目前技术上的一大进步。当然,这一技术目前还处在初级阶段。 以下是Facebook 官方博客的介绍: AI的长期目标之一是开发智能的聊天机器人,它们可以以自然的方式与人交谈。现有的聊天机器人有时可以完成特定的独立任务,但是无法理解多个句子或链接子任务来完成更大的任务。 更复杂的对话框,如预订餐厅或聊运动或新闻,需要具备理解多个句子的能力,然后对这些句子进行推理,以支持下一部分的对话。由于人类对话是如此多样化,聊天机器人必须对许多相关任务都十分熟练,这需要不同的专业知识,并且,这些专业知识使用是相同的输入和输出格式。为了实现这些目标,有必要构建统一这些任务的软件,以及可以从中学习的智能体(agents)。 认识到这一需求,Facebook AI Research(FAIR)团队已经建立了一个新的开源平台,用于在多任务中训练和测试对话模型,并且一次就能完成。 ParlAI(发音为“par-lay”)是对话研究的一站式商店,研究人员可以向单个共享存储库提交新任务并训练算法。并且,这一平台与Mechanical Turk是相互融合的,可用于数据收集、训练和评估,这也使得ParlAI 中的bots能够直接与人对话。这样做的目标是将现有的对话数据集与包含人与机器人之间真正对话的学习系统统一起来。 ParAI 对FAIR 现有的文本研究,比如快速高效的文本分类工具FastText 是一个很好的补充,对于Facebook的通用人工智能框架CommAI也是如此,因为他可以实现复杂任务的操作。 超20个公开数据集,5大任务类型 ParlAI本次公开的数据集中,包含了超过20个公开的数据集。见下图左边的框:
所有的任务被分为5个种类: (责任编辑:本港台直播) |