我们提出了一个新的用于视觉推理的语言数据集,包含92244对对应自然语句的合成图像样本,3962个不同句子。我们描述了众包语言多样性数据的方法,并提供对数据的分析。这些数据包含了视觉和集合推理所需的广泛语言现象。我们用多种模型对数据进行了实验,并提出这些数据可以作为未来研究的强有力挑战。 图:我们的语料库中的句子和图像样本。每个图像包含三个不同类型的物体。上方的句子是真值,下方的是假值。 最佳演示论文: Hafez:一个交互式诗歌生成系统 摘要 Hafez 是一个能够自动生成诗歌的系统,该系统结合了递归神经网络(RNN)和有限状态接受器(FSA)。它能够根据给定的任意主题生成十四行诗。此外,Hafez 允许用户通过调整各种风格设置来修改和润色生成的诗歌。实验证明,这样的“润色”机制考虑了用户的意图,能够产生更好的诗歌。在评估部分,我们构建了一个网络界面,用户可以用1到5颗星为每首诗歌的质量进行评分。利用词汇剪枝(vocabulary pruning)和GPU计算,我们将整个系统加快了10倍,从而能够快速收集足够的反馈。基于这些反馈,系统学习并调整其参数来提高生成诗歌的质量。 图1:Hafez 的整体架构 图2:(a)默认设置生成的诗歌;(b)用户调整风格设置生成的诗歌 最佳演示论文提名:OpenNMT:神经机器翻译开源工具包 摘要 本论文中,我们描述了神经机器翻译(NMT)的一个开源工具包,该工具包是效率优先、模块化而且可扩展,目的是支持NMT的模型结构、特征表示、和源模式研究,同时保持具有竞争力的性能和合理的训练要求。该工具包包括建模和翻译支持,以及有关底层技术的详细教学文档。 图:神经机器翻译的示意图。红色框的源词先被映射到词向量,然后馈入一个递归神经网络(RNN)。当看到<eos>符号时,最后一个时间步长初始化一个目标RNN(蓝色)。在每个目标时间步长,attention被应用于源RNN,并与当前隐藏的状态结合,产生下一个词的预测。这个预测接着被馈入目标RNN。 有关 OpenNMT 的更多解释,请参考新智元文章:【邓侃】哈佛大学机器翻译开源项目 OpenNMT的工作原理 终身成就奖:人工智能协同规划与人机交互 会上还同时公布了“终身成就奖”(Lifetime Achivement Award)——哈佛大学的 Barbara J. Grosz 教授上台领奖并发表了获奖感言。 Barbara J. Grosz 教授发表获奖感言 计算机科学的一个主要挑战是为易于使用、大规模的信息系统创建其科学和技术基础。人工智能研究的目的是理解使计算机系统的构造能够智能地行动的方式,并构建这样的系统。Grosz 教授的研究关注这两大议题,旨在开发计算机智能系统在长期、不确定、动态的环境中发挥作用所需的能力。Grosz教授的研究项目已经提出构建能够相互合作或与用户一起工作的系统的协同理论和模型。对于构建有用的助理,而不仅仅是工具,协同的能力是至关重要的。更好的人机交互,包括适当地处理中断,是这一挑战的重要部分。 (责任编辑:本港台直播) |