GNMT 文章中所描述的架构建立在之前算法的迭代之上。尽管十分复杂,它仍然遵循编码器-解码器的流程。它看起来可能让人望而生畏,但每个变化都是由一个简单的想法驱动的。
总结 谷歌神经网络翻译的架构非常有趣,它在算法上没有太多创新,真正精妙的地方在于架构设计。如果把它比作一条船,它的船型是如此的完美,能快速穿过充斥波浪的水域而不受一点阻力。以上我们已经讨论了执行各种任务的架构——有关翻译和自然语言生成,它们完全可以应用到其他大计算量的密集型任务中。我们希望很快就会见到这些方式的更多应用。 本文是谷歌新论文的一小部分介绍,没有详细讨论 BLEU 的细节,词汇级粒度(granularity)如何改进词级别的翻译效果,BLEU 的优缺点,在快速部署中量化模型,在各种优化算法中选择以获得更好收敛,以及在数据集过大情况下不要使用 dropout 等话题。 ©本文为机器之心编译文章,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |