实验设置。总体而来,实验使用了 10 张风格图像和 20 张内容图像。所有风格转换结果都是使用作者提供的代码 [43, 23, 27, 19, 8] 得到的,但 [14] 是例外。对于 [14],我们使用了一种有所修改的(见第 3 章)流行的开源代码 [22]。我们的实验中使用的所有这些代码的参数都是原作者对应论文提供的默认参数,但 [12, 9] 是例外。我们为 [12,9] 使用了作者提供的预训练的模型。对于我们实验中所有的生成式神经方法,直播,所有测试内容图像在训练过程中都没有被观察过。 5.1 定性评估
图 3:定性评估的一些结果示例
表 1:对于图 3 中图像上的六种算法的平均风格排名分数(∈ [1, 6]) 5.2 定量评估
表 2:在 256×256、512×512、1024×1024 三种像素大小上的神经风格迁移算法的速度比较(硬件:NVIDIA Quadro M6000) 6 应用 因为神经风格迁移的结果惊人,所以也带来了很多成功的业界应用并且也开始实现了商业回报。同时,也有一些应用论文调查了神经风格迁移技术在不同应用领域的应用方式 [4,25]。本节对这些应用进行了总结,并提出了一些潜在的用途。 6.1 社交 6.2 辅助用户创作的工具 6.3 用于娱乐应用的生产工具 7 难题与可能的解决方案 神经风格迁移领域的进展惊人,在产业中也已有所应用。尽管目前的算法取得了惊人的结果,该领域仍有一些挑战与仍待解决的问题。在此章节中,我们将总结神经风格迁移领域内的问题,并讨论对应的解决方案。 7.1 难题 参数调整的问题 笔触方向控制问题 神经风格迁移中「快」与「更快」的问题
图 4:带有画笔大小控制的描述性神经方法的高分辨率结果,以及不带画笔大小控制的生成式神经方法的高分辨率结果。 7.2 可能的解决方案 参数调整问题的解决方案。在未来自动参数调整问题的研究中,我们分别讨论了对描述性神经方法和生成式方法的解决方案。对描述性神经方法,可能的一个解决方案是跟随 Risser 等人的方法,进一步的结合一些无梯度信息,比如损失的量级以及损失内的统计。另一个方向是从分类问题中使用的自动参数优化策略获取灵感(例如,Domhan 等人的研究 [11],Luo 的研究 [32])。 对生成式神经方法,一种思路是研究不需要为不同风格训练单独模型的新方法(就像 [9]),同时还要保证结果的高质量。(也就是,突破速度、灵活性和质量之间的权衡)。然后参数调整的过程就不会特别耗费时间,而且把参数调整交给用户也可接受。此外,目前自动参数优化策略中的一些方法对生成式神经方法中的自动参数调整也会有帮助。 对笔触方向控制问题的可能解决方案。目前的神经风格迁移算法不考虑对笔触方向的控制。相反,在非真实感绘制技术(NPR:Non-photorealistic Rendering)领域,对笔触方向控制有很好的研究 [39]。我们相信 NPR 领域中的一些思路可被借鉴来解决神经风格迁移中的方向问题。例如,Zhang 等人要求用户明确笔触方向的位置与方式 [49],因为不同的用户有不同的偏好。同样的思路可借鉴到神经风格迁移算法中,要求用户提前选择全局笔触方向。此外,结合神经风格迁移算法和 NPR 领域中指导笔触方向的策略(例如,[50] 中的向量场方法)是该问题的另一个潜在的解决方案。 神经风格迁移中「快」与「更快」问题的解决方案。该研究方向的关键问题是如何突破速度、灵活性、质量三者的权衡。可能的一个解决方案是跟随 Chen 和 Schmidt 的研究 [9]。他们的算法是目前最有效的算法,但图片质量并不高。改进他们的方法所产生的风格迁移图像的质量是突破速度、灵活性、质量三者权衡的有潜力的方向。目前已有一些相关工作,比如 [51]。 (责任编辑:本港台直播) |