题目 Active Sentiment Domain Adaptation作者 Fangzhao Wu, Yongfeng Huang, Jun Yan 汇报人 吴方照 论文 摘要 情感分类是一个领域依赖的任务。不同的领域拥有不同的情感表达,因此一个领域训练得到的情感分类器在另一个领域往往效果不佳。由于网络文本涉及大量的领域,因此很难为每一个领域去标注足够多的样本来训练领域特定情感分类器。为此,该论文的研究人员提出了一个主动情感领域迁移的方法来解决该问题。他们的方法尝试基于主动学习策略选取少量有信息量的目标领域的有标注样本,从目标领域大量的无标注样本中挖掘词语间的领域特定情感关系,并通过结合以上两种信息将情感词典中的通用情感信息迁移到目标领域。在基准数据集上的实验表明,直播,该方法能够在少量有标注样本的情况下为目标领域训练准确的情感分类器。汇报人:吴方照 论文 题目 Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-based Chatbots作者 Yu Wu, Wei Wu, Chen Xing, Ming Zhou, Zhoujun Li 汇报人 武威 论文 摘要 聊天机器人的一个很重要的问题是如何在选择回复的时候考虑上下文。聊天上下文往往呈现层次结构并且有很多冗余信息,因此如何同时对聊天上下文的结构建模并且准确把握上下文中的要点成为了能否找到合适回复的关键。在这篇文章中,研究员们提出了一个序列匹配网。该网络通过二维卷积神经网和循环神经网的耦合可以很好地对上下文建模并且抓住上下文中的关键点。在大规模标准数据集上,该模型对已有模型有非常大的提升,并且有很好的解释性。另外,为了弥补学术界大规模标注数据的缺失,该文章还贡献出了一个标注数据集。链接 https://arxiv.org/abs/1612.01627 汇报人:武威 论文 题目 Selective Encoding for Abstractive Sentence Summarization作者 Qingyu Zhou, Nan Yang, Furu Wei, Ming Zhou 汇报人 周青宇 论文 摘要 句子摘要任务的目标是产生一个句子的简短概括。该论文的研究人员提出了选择性编码模型以改善生成式句子摘要的性能。他们的模型包含了一个句子编码器、选择门网络和带注意力机制的解码器。其中,句子编码器和解码器采用了循环神经网络。选择门网络通过控制从编码器到解码器的信息流来构建额外的一层信息表示,该层表示为句子摘要构建了量身定做的语义表示。研究人员在英文Gigaword、DUC 2004和MSR三个生成式句子摘要数据集上进行了测试。实验结果表明本文提出的选择性编码模型性能比当前最优基线模型有显著提高。链接 https://arxiv.org/abs/1704.07073 汇报人:周青宇 论文 (责任编辑:本港台直播) |