题目 Gated Self-Matching Networks for Reading Comprehension and Question Answering作者 Wenhui Wang, Nan Yang, Furu Wei, Baobao Chang,Ming Zhou 汇报人 杨南 论文 摘要 本文提出了一种针对机器阅读理解和问答任务的端到端的多层神经网络,模型主要由四部分组成。首先通过多层的双向循环神经网络得到问题和篇章的语义向量表示。第二步通过Attention机制和Gate机制学习文章和问题词汇级的匹配,从而得到篇章中每个词和问题的对齐及其重要程度。第三步通过Self-Matching机制,对答案所需要的篇章中的证据和问题信息进行进一步聚合,得到最终的篇章中每个词的语义向量表示。最后使用Pointer Networks得到答案在篇章中的起始位置和结束位置,进而得到问题的最终答案。在Stanford发布的机器阅读理解比赛数据集SQuAD上,本文提出的模型(R-Net)的单模型和集成模型结果都分别排名第一。链接 https://www.microsoft.com/en-us/research/publication/mrc/ 汇报人:杨南 论文 题目 Adversarial Training for Unsupervised Bilingual Lexicon Induction作者 Meng Zhang, Yang Liu, Huanbo Luan, Maosong Sun 汇报人 张檬 论文 摘要 本论文提出了利用对抗学习从非平行文本自动构建双语词典,利用向量空间映射发现双语之间的关联性,克服了传统方法依赖于种子词典的缺点,实现了完全不依赖双语信息、仅利用单语文本构建双语词典的任务,显著提升了机器翻译处理低资源语言的能力。链接 ~ly/papers/acl2017_zm.pdf 汇报人:张檬 论文 题目 Adversarial Multi-Criteria Learning for Chinese Word Segmentation作者 Xinchi Chen, Zhan Shi, Xipeng Qiu, XuanjingHuang 汇报人 陈新驰 论文 摘要 不同的语言视角往往导致许多不同细分标准的中文分词语料。大多数现有的方法侧重于改进使用单个标准的语料下的分词性能。如果能利用不同标准的语料来提升分词的效果是很有意义的。在这篇文章中,科研人员使用对抗训练的思想,通过多目标集成学习的方法来学习多个异构标准的分词语料集。在8种不同标准的语料库上的实验表明,相比较于单标准学习方法,模型在每个语料集上的性能都获得了显著改进。链接 https://arxiv.org/abs/1704.07556 汇报人:陈新驰 (责任编辑:本港台直播) |