风格迁移是近来人工智能领域内的一个热门研究主题,机器之心也报道了很多相关的研究。近日,来自浙江大学和亚利桑那州立大学的几位研究者在 arXiv 上发布了一篇「神经风格迁移(Neural Style Transfer)」的概述论文,对当前神经网络风格迁移技术的研究、应用和难题进行了全面的总结。机器之心对该论文的部分内容进行了编译介绍,论文原文请访问:https://arxiv.org/abs/1705.04058。此外,为方便进一步的扩展阅读,机器之心还在文末汇总了我们曾经发布过的风格迁移相关文章。
摘要 Gatys 等人的近期研究证实了卷积神经网络(CNN)的力量:通过分离和重新组合图片内容与风格,CNN 可以创作出具有艺术魅力的作品。使用 CNN 将一张图片的语义内容与不同风格融合起来的过程被称为神经风格迁移(Neural Style Transfer)。从那以后,在学术研究和产业应用中,神经风格迁移已成为一个很受欢迎的主题,不仅日益受到计算机视觉研究者的关注,研究人员还提出了几种方法来提升或扩展 Gatys et al. 提出的神经算法。不过,有关这方面的全面综述、总结性文献还付之阙如。这篇论文回顾了神经网络风格迁移研究近期取得的进展,并讨论了这一技术的不同应用以及尚未解决的问题,这也是未来研究的方向。
图 1:使用了 Gatys 等人的风格迁移算法的例子,将中国画风格(b)转移到了一张长城相片(a)上。提供风格的那幅作品是黄公望的《富春山居图》。 1 引言 本文的余下部分的逻辑结构如下。第 2 节对现有的神经风格迁移方法进行分类,并详细解释了这些方法。第 3、4 节介绍了这些方法的一些改进以及扩展。文章第 5 节给出了风格化输出效果的评估方法。第 6 节讨论了这些神经风格迁移方法的商业化应用。最后,第 7 节总结了当前面临的挑战以及可能的解决方案。第 8 部分总结全文并抛出了几个有前途的研究方向。 文章所涉论文以及相应的代码、预训练模型请移步至:https://github.com/ ycjing/Neural-Style-Transfer-Papers 2 神经风格迁移方法的二分法 在这一部分,我们提出了一种分类方法。当前的神经风格迁移方法符合其中之一:基于图片迭代的描述性神经方法(Deive Neural Methods Based On Image Iteration)和基于模型迭代的生成式神经方法(Generative Neural Methods Based On Model Iteration)。第一类方法通过直接迭代更新图片像素来实现图像风格迁移,第二种方法首先会迭代优化生成模型,接着通过一个单独前向通过来生成风格化图像。 2.1 基于图像迭代的描述性神经方法(Deive Neural Methods Based On Image Iteration) 第一个用来转移图片风格的神经方法就是描述性神经方法。这一方法会从随机噪音开始,通过反向传播迭代更新(尚未知晓的)风格化图像。图像迭代的目标是最小化总损失,这样风格化后的图像就能同时将内容图像的内容与风格图像的风格匹配起来。 神经风格迁移的关键之一就是风格表征(representation of style),即预定义的风格损失函数。风格损失函数会被优化以匹配风格图像特征统计。根据采用的风格损失函数不同,我们可以进一步将这一方法分为基于最大均值差(MMD)的方法和基于马尔科夫随机场(MRF)的方法。简便起见,我们称之为基于 MMD 和基于 MRF 的方法。 2.1.1 基于 MMD 的描述性神经方法 MMD 是一个很受欢迎的评估两个分布之差的标准,以希尔伯特空间特征均值为基础[20]。最近,Li 等人的研究表明风格迁移能够被视为一个从内容图像到风格图像的分布对齐过程 [30]。因此,MMD 能被用于测量风格差异。基于 MMD 的描述性神经方法是指使用带有不同核函数的 MMD 作为优化的风格损失的神经方法。 2.1.2 基于 MRF 的描述性神经方法 MRF 是一种用于图像合成的经典框架。假设局部图像块包含了一张图像中的最相关统计依存性。描述性神经方法的第二类是以 MRF 为基础的,还考虑到了局部水平的神经风格迁移,比如局部图像块的风格匹配。 2.2 基于模型迭代的生成式神经方法 (责任编辑:本港台直播) |