本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】深度 | 迁移学习全面概述:从基本概念到相关研究(5)

时间:2017-03-28 03:40来源:香港现场开奖 作者:118开奖 点击:
最后,在我看来,迁移学习的另一个杀手级别的应用是将知识从一种语言迁移到另一种语言,我曾经在此处写过一篇关于跨语言环境的嵌入式模型的文章(

最后,在我看来,迁移学习的另一个杀手级别的应用是将知识从一种语言迁移到另一种语言,我曾经在此处写过一篇关于跨语言环境的嵌入式模型的文章(博文链接:)。可靠的跨语言域的方法会允许我们借用大量的已有的英文标签数据并将其应用在任何一种语言中,尤其是没有足够服务且真正缺少资源的语言。已有的最先进的方法看起来仍然太过理想,但是以 zero-shot 翻译 [11] 为例的最近的进展已在这个领域取得了快速的进步。

虽然到目前为止我们已经考虑过一些迁移学习的特殊应用,但是现在我们要研究一下文献中那些解决了一些挑战的实际方法和方向。

迁移学习的方法

在解决前文提及的四种迁移学习场景上,迁移学习拥有悠久的研究和技术的历史。深度学习的出现导致了一系列迁移学习的新方法,我们下面将会概览其中的一些。参考文献 [6] 可以看到一些早期方法的综述。

  使用预训练的 CNN 特征

为了了解目前应用中最常见的迁移学习方式,我们必须理解在 ImageNet 上大型卷积神经网络所取得的杰出成功 [12]。

理解卷积神经网络

虽然这些模型工作方式的许多细节仍然是一个谜,但我们现在已经意识到,较低的卷积层捕获低级图像特征,例如边缘(见图 14),而较高的卷积层捕获越来越复杂的细节,例如身体部位、面部和其他组合性特征。

  

【j2开奖】深度 | 迁移学习全面概述:从基本概念到相关研究

图 14:AlexNet 学习得到的实例滤波器 (Krizhevsky et al., 2012)

最后的全连接层通常被认为是捕获了与解决相应任务相关的信息,例如 AlexNet 的全连接层可以指出哪些特征与在 1000 个物体类中分类一张图片相关的。

然而,尽管知道一只猫有胡须、爪子、毛皮等是将一个动物识别为猫所必需的(参见图 15),但它并不能帮助我们识别新物体或解决其他共同的视觉任务(如场景识别、细粒度识别、属性检测和图像检索)。

  

【j2开奖】深度 | 迁移学习全面概述:从基本概念到相关研究

图 15:这篇博文的标志猫

然而,能够帮助我们的是捕获关于一幅图像是如何组成的以及它包括什么样的边缘和形状组合的通用信息。正如我们之前所描述的,这种信息被包含在在 ImageNet 上训练出的卷积神经网络的最后卷积层或者最后一层之前的全连接层。

所以,对于一个新任务,我们可以简单地使用这种由最先进的卷积神经网络在 ImageNet 上预训练出的现成特征,并在这些抽象的特征上面训练出新的模型。在实际中,我们要么保持预训练的参数固定不变,要么以一个较小的学习率来调节它们,以保证我们不会忘记之前学习到的知识。这个方法已经被证明可以在一系列的视觉任务 [13] 以及一些依靠图像作为输入的任务(例如看图说话)上实现出色的结果。在 ImageNet 上训练出的模型似乎能够捕获到关于动物以及物体的构造和组成方式的细节,这种方式通常在处理图像的时候是有价值的。因此,ImageNet 上的任务似乎对于一般的计算机视觉问题来说是一个很好的代理(proxy),因为在其中所需的相同知识也与许多其他任务相关。

学习图像的隐含结构

一个类似的假设被用来推动生成模型:当训练一个生成模型的时候,我们假设生成逼真图像的能力需要对图像隐含结构的理解,它反过来可以被用在很多其他任务中。这个假设本身也依赖一个前提,即所有图像都由一个低维度的流形结构决定,这就是说,可以用一个模型来抽象出图像的隐含结构。利用生成对抗网络来生成逼真图片的最新进展揭示,这种模型或许真的存在,如图 16 所示,卧室空间的点之间的逼真过渡证明了这个模型的能力。

  

【j2开奖】深度 | 迁移学习全面概述:从基本概念到相关研究

图 16:行走在卧室的图像流形中

预训练的特征在视觉之外的领域有用吗?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容