码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领(2)_本港台直播_J2开奖直播

模型分为四部分：一是使用多层双向神经网络编码问题和篇章的语义向量表示；二是使用门注意力机制得到问题感知的篇章的语义向量表示；三是通过Self-Matching注意力机制提炼篇章的语义向量表示，从全部篇章中编码最终语义向量表示；四是利用Pointer-network来预测答案边界，从而得到最终答案。在Stanford发布的机器阅读理解比赛数据集SQuAD上，本文提出的模型的单模型和集成模型结果都分别排名第一。

码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领

2、Coarse-to-Fine Question Answering for Long Documents

大规模文档中检索答案在时间有效性上目前仍是一大挑战，由华盛顿大学和谷歌等多家机构联合发表的这篇文章中，针对大规模文档检索提出了一种高效检索并保持甚至提高目前最先进模型性能的架构 - 模型分层对文档检索。首先使用快速模型从大规模文档中选择问题相关的少量句子：使用三种不同句子简单表示方式处理大规模文档，然后利用Hard或Soft注意力机制得到文档的一个摘要表示，并使用三种不同方式选择少量候选句子，然后才用相对慢速的端到端神经网络模型从候选句子中产生最终结果。在WIKIREADING部分数据集上，实验结果显示此框架可以比基础模型检索速度高出3.5到6.7倍。

码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领

机器翻译

Machine Translation

粗略统计，本届ACL有27篇机器翻译相关的论文（15篇长文+12篇短文）。我们重点关注其中三个较有代表性方向的相关研究工作，并总结了相关趋势。

一、基于句法的翻译模型

本次会议中，有关如何在神经网络翻译模型中引入句法信息的工作共有8篇，是本届会议中机器翻译领域的一个重要方向。受过去统计机器翻译发展脉落（从基于字符串的翻译模型到基于句法树的翻译模型）的启发，来自不同单位的研究者探讨了各种引入句法信息的方式，包括引入源端句法树或目标端句法树，使用成分句法树或依存句法树及至浅层组块结构。

腾讯AI Lab研究员参与的两个研究[1-2]分别探索了从源端和目标端引入句法信息的可能性。第一个工作通过使用一种简单有效的方式将句法树转化为句法标签序列，在不更改序列到序列模型框架的条件下将源端句法信息引入神经网络翻译系统中。第二个工作则是在解码器端引入一个额外的组块层，通过限定每个组块短语中的所有词共用一个组块层状态及源端上下文向量，不仅引入了目标端的句法信息，同时以一种比较巧妙的方式引入“短语”翻译。

* [1] Modeling Source Syntax for Neural Machine Translation; [2]Chunk-Based Bi-Scale Decoder for Neural Machine Translation

码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领

二、神经网络的理解和可视化

神经网络机器翻译模型自2014年被提出以来，一个主要问题是神经网络结构及运行过程的不可解释性，让研究者无法根据翻译出现的问题对网络结构进行针对性改进设计，从而引发一个重要问题 - 当前神经网络模型无法保证将源端语义内容无损传递至目标端，让生成的译文流畅度较好但忠实度不足，比如遗漏翻译或过度翻译错误。

本次会议有两篇论文尝试理解及可视化神经网络模型，其中一篇ACL Outstanding Paper来自清华大学NLP组[1]，他们提出了一种新的可视化方法，通过计算神经网络中任意两个神经元之间的相关性，为分析、理解和调试神经网络机器翻译提供了可能性。

[1] Visualizing and Understanding Neural Machine Translation

码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领

另一篇论文[2]则通过外在词性和形态标注任务来评判通过不同粒度方法训练得到的词语表示，分析神经网络翻译模型对词语的理解能力。

[2]What do Neural Machine Translation Models Learn about Morphology?

三、神经网络结构的改进

本次会议同样有多篇工作尝试对当前神经网络结构进行改进，其中三篇工作比较有代表性：

1、A Convolutional Encoder Model for Neural Machine Translation

在编码器端使用卷积神经网络（CNN）代替主流的递归神经网络（RNN），在效果相当的前提下速度提升近2倍。

码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领

2、Deep Neural Machine Translation with Linear Associative Unit

为当前主流的非线性Gating RNN（比如LSTM或GRU）提供了一种线性的可能替代（Linear Associative Unit），在深层神经网络中取得了较好效果。

码报:腾讯AI Lab独家解析：深度聚焦ACL 2017三大研究领

3、Neural Machine Translation via Binary Code Prediction

(责任编辑：本港台直播)