自动翻译的传统解决方案包括基于短语的变量匹配。这一方法需要大量语言领域的知识而且这一设计最终也被证实太脆弱也缺乏泛化能力。传统解决方案的问题之一就是一点一点地翻译输入句子。结果,更有效的解决方法是一次翻译整个句子,这种方法让更广泛的上下文以及更加自然的语词再安排成为可能。 网络架构 该论文的作者介绍了一个深度 LSTM 网络,能够用 8个解码器和编码器层进行端到端的训练。我们能把该系统分解成3个组件:编码器RNN、解码器RNN、注意模块。从高层级来看,编码器要做的任务是将输入语句转换成向量表征,然后解码器产生输入表征,然后注意模块提示解码器在解码的过程中应该注意什么(这是利用输入语句全部语境的思路所在)。
论文的其他部分主要专注于规模化该服务的挑战上。计算资源量、时延、高容量部署这样的话题都进行了长篇介绍。 结论 在此博客中,我们总结了深度学习如何帮助了自然语言处理任务。在我的认识中,该领域内的一些未来目标包括:改进消费者服务聊天机器人、完美的机器翻译,并且希望能让问题回答系统掌握对无结构文本或长文本(比如 wikipedia 文本页)更深的理解能力。 原网址:https://adeshpande3.github.io/adeshpande3.github.io/Deep-Learning-Research-Review-Week-3-Natural-Language-Processing ©本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |