@inproceedings{chen2017reading,title={Reading {Wikipedia} to Answer Open-Domain Questions}, author={Chen, Danqi andFisch, Adam andWeston, Jason andBordes, Antoine}, booktitle={Association forComputational Linguistics (ACL)}, year={ 2017}} 与 ParlAI 连接 这个 DrQA 文档阅读器实现与 ParlAI 中的文档阅读器有紧密关联。但是这里的研究得到的扩展,以便能在开放域环境中与文档检索器进行交互。即使当 ParlAI API 的限制解除时(比如在预处理和回答范围等方面),它也或多或少在训练上更高效,而且能实现稍微更好的表现。 我们也计划将这个模型整合到 ParlAI 接口中,以便其阅读器可以使用 ParlAI 进行可交替的训练或在许多数据集上多任务执行。有关 ParlAI 的更多信息,可参阅机器之心文章《资源 | Facebook 开源人工智能框架 ParlAI:可轻松训练评估对话模型》。 证书 DrQA 使用 CC-BY-NC 证书。 论文:阅读维基百科以回答开放域问题(Reading Wikipedia to Answer Open-Domain Questions) 论文链接:https://arxiv.org/abs/1704.00051 本论文提出可使用维基百科作为唯一知识源来解决开放域问答问题(open-domain question answering):任何事实性问题的答案都是一篇维基百科文章里面的一段文本。这种大规模机器阅读任务将文档检索难题(寻找相关文章)与文本的机器理解(在这些文章中确定答案的范围)。我们的方法结合了基于二元语法哈希(bigram hashing)和 TF-IDF 匹配的搜索组件与一个训练用于检测维基百科段落中答案的多层循环神经网络。我们在多个已有问答数据集上的实验表明:(1) 这两个模块与当前的竞争者相比都有很高的竞争力,(2) 在它们的组合上使用远程监督(distant supervision)的多任务学习是在这种高难度任务上的有效完备系统。 (责任编辑:本港台直播) |