本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:LSTM、GRU与神经图灵机:详解深度学习最热门的循(4)

时间:2017-07-09 13:36来源:本港台现场报码 作者:www.wzatv.cc 点击:
神经图灵机通过将神经网络与外部记忆资源耦合而对该神经网络的能力进行了延展——它们可以通过注意(attention)过程与外部记忆资源交互。参阅机器之

神经图灵机通过将神经网络与外部记忆资源耦合而对该神经网络的能力进行了延展——它们可以通过注意(attention)过程与外部记忆资源交互。参阅机器之心文章《神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机》。

这种组合的系统类似于图灵机或冯·诺依曼结构,但它是端到端可微分的,使得其可以有效地使用梯度下降进行训练。

初步的结果表明神经图灵机可以根据输入和输出样本推理得到基本的算法,比如复制、排序和联想回忆(associative recall)。

RNN 相比于其它机器学习方法的突出之处在于其在长时间范围内学习和执行数据的复杂转换的能力。此外,我们都知道 RNN 是图灵完备的,因此其有能力模拟任意程序,只要连接方式合适即可。

标准 RNN 的能力被扩展以简化算法任务的解决方案。这种丰富性主要是通过一个巨大的可寻址的记忆实现的,所以通过类比于图灵的通过有线存储磁带实现的有限状态机(finite-state machine)的丰富性,其被命名为神经图灵机(NTM)。

和图灵机不同,神经图灵机是一种可微分的计算机,可以通过梯度下降训练,从而为学习程序提供了一种实用的机制。

wzatv:LSTM、GRU与神经图灵机:详解深度学习最热门的循

神经图灵机架构。NTM 架构大体上如上所示。在每一个更新循环中,控制器网络接收一个来自外部环境的输入并给出一个输出作为响应。它也会通过一系列并行的读写头来读写一个记忆矩阵(memory matrix)。虚线是 NTM 回路与外部世界的分界线。来自 2014 年的《Neural Turing Machines》

关键在于,该架构的每个组件都是可微分的,使其可以直接使用梯度下降进行训练。这可以通过定义「模糊(blurry)」的读写操作来实现,其可以或多或少地与记忆中的所有元素进行交互(而非像普通的图灵机或数字计算机那样处理单个元素)。

更多信息请参阅:

A. Graves 等人 2014 年的《Neural Turing Machines》:https://arxiv.org/pdf/1410.5401.pdf

R. Greve 等人 2016 年的《Evolving Neural Turing Machines for Reward-based Learning》:

NTM 实验

复制(copy)任务可以测试 NTM 是否可以存储和回调长序列的任意信息。向该网络提供一个随机二进制向量的输入序列,后面跟着一个分隔符。

该网络被训练用来复制 8 位的随机向量序列,其中序列长度是在 1 到 20 之间随机的。目标序列就仅仅是输入序列的副本而已(没有分隔符)。

重复复制任务是复制任务的扩展,即要求该网络输出被复制的序列给定的次数,然后给出一个序列终止标志。这个任务的主要目的是看 NTM 是否可以学习简单的嵌套函数。

该网络的输入是随机长度的随机二进制向量序列,后面跟着一个标量值,表示我们想要的副本的数量,其出现在一个单独的输入信道上。

联想记忆任务(associative recall tasks)涉及到组织间接产生的数据,即当一个数据项指向另一个项的时候。要创建一个项列表,使得查询其中一个项时需要该网络返回后续的项。

我们定义了一个二进制向量序列,通过分隔符对其左右进行了限制。在几个项被传播到该网络中后,通过展示随机项对该网络进行查询,看该网络是否可以产生下一个项。

动态 N-gram 任务测试的是 NTM 是否可以通过使用记忆作为可覆写的表格来快速适应新的预测分布;该网络可以使用这个表格来持续对转换统计保持计数,从而模拟传统的 N-gram 模型。

考虑在二进制序列上的所有可能的 6-gram 分布的集合。每个 6-gram 分布都可以被表达成一个有 32 个数字的表格,其基于所有可能长度的 5 个二进制历史指定了下一位(bit)为 1 的概率。通过使用当前的查找表绘制 200 个连续的位,会生成一个特定的训练序列。该网络对该序列进行观察,一次一位,然后被要求预测出下一位。

优先级排序任务测试的是 NTM 的排序能力。该网络的输入是一个随机二进制向量的序列,以及每个向量的一个标量优先级评分。该优先级是在 [-1, 1] 范围内均匀分布的。目标序列是根据它们的优先级排序后的二进制向量序列。

NTM 有 LSTM 的前馈结构作为它们的组件之一。

总结

你通过这篇文章了解了用于深度学习的循环神经网络。具体来说,你了解了:

用于深度学习的顶级循环神经网络的工作方式,其中包括 LSTM、GRU 和 NTM。

顶级 RNN 与人工神经网络中更广泛的循环(recurrence)研究的相关性。

RNN 研究如何在一系列高难度问题上实现了当前最佳的表现。

原文链接:

本文为机器之心编译,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):[email protected]

投稿或寻求报道:[email protected]

广告&商务合作:[email protected]

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容