本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【组图】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机(4)

时间:2017-04-11 20:20来源:668论坛 作者:118开奖 点击:
另外一个方法,也是比较有趣的,那就是 curriculum learning,就是在开始的时候喂一些简单的数据。你从序列开始,让它学习复制一些东西到某一长度,比如

另外一个方法,也是比较有趣的,那就是 curriculum learning,就是在开始的时候喂一些简单的数据。你从序列开始,让它学习复制一些东西到某一长度,比如说 5。当它可以把这个做得很好时,你再将长度增加到 10,然后再某一点,你达到了新的长度,比如说 20,然后在某一点你相当自信你可以将模型泛化,就像我们之前看到的,将复制序列的长度增大到 100 或者更大。

码报:【j2开奖】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机

现在我要继续讨论最近的扩展。非常令人兴奋,如果我没有记错的话,它是在几个星期之前出现在 Nature 上的。它以一些有趣的方式扩展了神经图灵机,并且帮助解决了一些问题。

码报:【j2开奖】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机

微分神经计算机(参见机器之心文章)或者最近的一些模型本质上就是经过一些修改的神经图灵机。从某种程度来说,它们放弃了基于索引移动的寻址方式。我之前一直在讲沿着记忆或者磁带的移动。它们不再这样做;它们尝试基于它们看到的东西直接在记忆中搜索给定的向量。它们还有分配记忆和释放记忆的能力,如果你曾经使用过某种低水平的编程语言的话,你就会理解这个。以同样的方式,很难跟踪记忆区域中的内容,所以你不会在编程中犯错误,这样很容易将记忆中的某个区域标记为禁止访问,因此你不会在以后意外地删除它们,这有助于优化。它们也有那种将序列输入序列进行本地记忆地能力。当神经图灵机学习复制的时候,它们学习将所有地输入按顺序写进记忆,并回到记忆地开头将它们读出来这个过程。在这种情况下,从某种程度来说它们拥有了某种形式的时间记忆(temporal memory),在瞬时记忆中它们可以回想起它们所做的上一件事,上一件事的上一件事,以此类推,这意味着它们可以遍历由它们需要做的事组成地一个链表。

码报:【j2开奖】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机

这是可微分神经计算机体系结构的总结。你们看到的左边的图表代表的是输入和输出变量的长度,然后读头和写头允许计算机在记忆区进行存取。这里你可以看到它一次读入整个向量并在第 6 区域写入。就像我之前描述过的,记忆区域在右边有一个附加的暂时链接。如果你追踪这些箭头,你会看到实际上这些箭头就是模型能够回想并重复它最近的输入和输出的方式。

码报:【j2开奖】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机

这里我们看到的图片展示的是可微分计算机也在执行复制的任务。你看到的绿色的方块是它写入记忆中的东西,紫色的方块是它从记忆中读出来的内容。通常,当你给它输入一些序列的时候,如果你沿着左边看的话,你所看到的正在发生的事是计算机正在释放某些区域的记忆,因为它需要写入东西,所以这是在分配记忆,底部的方块显示了这个活动。然后,当写入完成之后,输出。然后,它就会说,「做好了,我们可以重新分配这块记忆了」。你就会得到这种交替的模式,「我需要这块记忆。好了,我做好了。我需要这块记忆......」可微分神经计算机确实学会了做这件事,这使事情变得更加容易,让这些事情变得更加有趣。

码报:【j2开奖】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机

动态神经计算机在推理任务上的性能

  我从为见过的让计算机之间显得有些不同的例子就是它们能够做这种逻辑推理的事情,虽然是结合了某种模糊的推理。你在这里看到的是一个家族树(family tree),用这个家族树去训练模型,本质上,「Mary 是 Jodie 的女儿」,或者「Simon 是 Steve 的儿子」。那么,你问计算机:「Freya 和 Fergus 是什么关系?」或者「Freya 和 Fergus 是什么关系?」答案是舅舅,所以它们确实是能够回答这个问题的。如果你去读这篇论文的话,你会发现一些有趣的例子,直播,例如学会找最短路径,横穿伦敦地铁系统的图结构以及类似的东西,这些都是有趣的。我这里没有相关的幻灯片,但是如果你对它很感兴趣,强烈建议你读一下 Nature 上的这篇文章,链接如下:

码报:【j2开奖】神经图灵机深度讲解:从图灵机基本概念到可微分神经计算机

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容