在未发表的成果中,他们已经将该系统应用于数千份关于乳腺活检的病理报告,在那里它已经学会提取文本来为病理学家作解释以提供诊断基础。他们甚至使用它来分析乳房的 X 线照片,其中第一个模块提取图像的部分而不是文本的部分。 东北大学计算机与信息科学助理教授 Byron Wallace 说:「现在关于深入学习有很多炒作,特别是用于自然语言处理的深度学习。」「但这些模型的一个很大缺点是,它们通常是黑箱。拥有一个不仅可以做出非常准确的预测,还可以告诉你为什么做这些预测的模型是一个非常重要的目标。 「实现这一目标后,我们在同一会议上会提交一份主旨相似的论文,」Wallace 补充说。「我当时不知道 Regina 正在做这个,实际上我认为她的更好。我们的方法在培训过程中,当有人告诉我们,atv直播,例如,某个电影评论是非常积极的,我们假设他们会标记一个句子并给你理由。我们利用这种方式来训练深度学习模型去提取这些理由。但他们不做这个假设,所以他们的模型运行时没有使用带有标记的直接注释,这是一个非常好的方式。」 论文:Rationalizing Neural Predictions
摘要:没有根据(justification)的预测往往限制了其应用。作为补救,我们学习提取输入文本的碎片作为根据(或者说论据,rationales),裁剪出的文本要短却具有相干性,而且足够做出同样的预测。我们的方法是结合两个模块,也就是生成器和编码器,训练后的模块要很好的协同运行。生成器指定在文本段上的一组分布作为候选论据,然后将这堆论据输入编码器进行预测。论据不是在训练过程中给出的。该模型通过渴求论据而被正则化。除了手动注释的测试案例,我们在多方面情感分析上评估该方法。我们的方法以显著的优势超过了基于注意力的基线,我们也成功的在问题检索任务上解释了该方法。 ©本文由机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |