在结构性预测中,如何控制过拟合的风险?这一讲座会对最近的模型和方法进展提供清晰的概览,并在NLP任务中使用结构化预测时解决上述问题。我们将会引入大型的编辑方法(比如,认知器、MIRA)、图像模型(CRF)和深度学习方法(RNN, LSTM),并分别展示这些方法在NLP应用中的优势和劣势。对于训练算法,我们将会介绍在线/随机训练方法,同时,我们也会介绍并行的在线/随机学习算法和理论,来推动训练(例如,Hogwild 算法)。在控制训练数据的过拟合问题上,我们将会介绍加权重规则化、结构规则化和简单规则化的方法。 最佳论文 最佳长论文 题目:通过强化学习获取外部证据提高信息提取精度 作者:MIT 人工智能实验室 Karthik Narasimhan,Adam Yala,Regina Barzilay 摘要 许多成功的信息提取系统通过访问大量文档进行。在这项研究中,我们探讨了在训练数据不足的领域,通过获取并合并外部证据来提高信息提取的精确度。这个过程需要发出搜索指令,从新源中提取并调和提取值,重复该过程直到收集到足够的证据。我们使用强化学习框架来处理这个问题,我们的模型能基于上下文信息学习选择出最佳动作。我们使用深度Q网络训练,以优化反映提取精度的回报函数,同时惩罚额外努力。我们在两个数据库(枪击事件和食物掺假事件)上的实验表明,我们的系统显著优于传统提取器和元分类器基线。 题目:全局性神经CCG分析 作者:华盛顿大学,Kenton Lee, Mike Lewis, Luke Zettlemoyer . 摘要 我们在论文中介绍了首个全局性递归神经分析模型,并在解码中使用优化的保证。为了支持全局性特征,我们放弃了动态的程序,转而在所有可能的子树空间中直接进行搜索。虽然这一空间在句子长度呈现了指数级的增长,我们证明,学习一个有效的A*分析是有可能的。我们对现有的分析模型进行了增强,这些模型 在外部分数上拥有信息集。全局性的模型的信息集较为宽松,但是只需要对非本地化的现象进行建模。全局模型使用了一种新颖的客观对象进行训练,鼓励分析器搜索有效且准确的东西。这一方法被用于CCG分析,将最好的准确率提升了0.4 F1。 最佳短论文 题目:从音素格中学习词库及翻译模型 作者:Oliver Adams, Graham Neubig, Trevor Cohn, Steven Bird, Quoc Truong Do and Satoshi Nakamura 摘要 语言的记录开始于口语的收集。由于缺少正字法或先有词库,字词级的手动或自动转写通常是不可能的。尽管手动进行音位转写可以做到,但非常耗时。另一方面,少数民族语言翻译成主流语言更容易实现。我们提出一种利用这种翻译来改善自动音素识别的方法。该方法假定没有先有词库或翻译模型,而是从音素位和已经转写的话语的翻译中学习词库和翻译模型。实验表明该方法在两个基线上的音素错误率有所降低,模型学习双语词汇条目的能力得到提高。 最佳资源论文 题目:SQuAD:机器理解 Text Pranav 10万+ 问题 作者:斯坦福大学计算机科学系 Rajpurkar,Jian Zhang,Konstantin Lopyrev & 摘要 我们推出了斯坦福问答数据库(SQuAD),这是一个新的阅读理解数据库,包含10万+ 维基百科中文章里的问题。在这个数据库中,每一个问题都是从相应的阅读文章中提取出来的 。我们对数据库进行分析,以理解要回答问题所需的推理的种类,在dependency和constituency trees 上进行了大量的学习。我们建立以一个强大的逻辑回归模型,获得了F1级 的分数,准确率在51%,比起简单基准的 20%有显著提升。但是,人类的表现(86.8%)还是要好得多,这也预示着,数据库提出了一个未来研究的难点问题。现在,该数据库可以免费获得: https://stanford-qa.com. 【在新智元后台回复“1016”下载论文(包括 2 篇最佳论文提名论文)】
豪华嘉宾阵容,共飨 AI 盛宴
7 大院长齐聚新智元智库院长圆桌论坛 (责任编辑:本港台直播) |