本文综述了生成式对抗网络 GAN 的最新研究 进展, 并对发展趋势进行展望. 第 1 节介绍 GAN 的 提出背景. 第 2 节描述 GAN 的理论与实现模型, 包 括 GNN 的基本原理、学习方法、衍生模型等. 第 3节列举GAN在图像和视觉、语音和语言、信息安全 等领域的典型应用. 第4节对 GAN 进行思考与展 望, 讨论 GAN 与平行智能, 特别是与计算实验的关 系. 最后, 第 5 节对本文进行总结。 1. GAN 的提出背景 本节介绍 GAN 的提出背景, 以便读者更好地理解 GAN 的研究进展和应用领域. 1.1 人工智能的热潮 近年来, 随着计算能力的提高和各行业数据量 的剧增, 人工智能取得了快速发展, 使得研究者对人 工智能的关注度和社会大众对人工智能的憧憬空前提升[2,9]. 学术界普遍认为人工智能分为两个阶段:感知阶段和认知阶段. 在感知阶段, 机器能够接收来 自外界的各种信号, 例如视觉信号、听觉信号等, 并 对此作出判断, 对应的研究领域有图像识别、语音识别等. 在认知阶段, 机器能够对世界的本质有一定的 理解, 不再是单纯、机械地做出判断。基于多年的研 究经验, 本文作者认为人工智能的表现层次包括判 断、生成、理解和创造及应用, 如图 1 所示. 一方面,这些层次相互联系相互促进; 另一方面, 各个层次之间又有很大的鸿沟, 有待新的研究突破. 无论是普遍认为的人工智能两阶段还是本文作者总结的人工智能四个层次, 其中都涉及理解这个 环节. 然而, 理解无论对人类还是人工智能都是内 在的表现, 无法直接测量, 只能间接从其他方面推 测. 如何衡量人工智能的理解程度, 虽然没有定论但是著名学者 Feynman 有句名言 “What I cannot create, I do not understand. (不可造者, 未能知也.)” 这说明机器制造事物的能力从某种程度上取 决于机器对事物的理解. 而 GAN 作为典型的生成 式模型, 其生成器具有生成数据样本的能力. 这种 能力在一定程度上反映了它对事物的理解. 因此, GAN 有望加深人工智能的理解层面的研究.
1.2 生成式模型的积累 生成式模型不仅在人工智能领域占有重要地位,生成方法本身也具有很大的研究价值. 生成方法和 判别方法是机器学习中监督学习方法的两个分支.生成式模型是生成方法学习得到的模型. 生成方法 涉及对数据的分布假设和分布参数学习, 并能够根 据学习而来的模型采样出新的样本. 本文认为生成 式模型从研究出发点的角度可以分为两类: 人类理 解数据的角度和机器理解数据的角度. 从人类理解数据的角度出发, 典型的做法是先 对数据的显式变量或者隐含变量进行分布假设, 然 后利用真实数据对分布的参数或包含分布的模型进 行拟合或训练, 最后利用学习到的分布或模型生成 新的样本. 这类生成式模型涉及的主要方法有最大 似然估计法、近似法[10?11]、马尔科夫链方法[12?14]等. 从这个角度学习到的模型具有人类能够理解的 分布, 但是对机器学习来说具有不同的限制. 例如,以真实样本进行最大似然估计, 参数更新直接来自 于数据样本, 导致学习到的生成式模型受到限制. 而 采用近似法学习到的生成式模型由于目标函数难解 一般只能在学习过程中逼近目标函数的下界, 并不 是直接对目标函数的逼近. 马尔科夫链方法既可以 用于生成式模型的训练又可以用于新样本的生成,但是马尔科夫链的计算复杂度较高. 从机器理解数据的角度出发, 建立的生成式模 型一般不直接估计或拟合分布, 而是从未明确假设 的分布中获取采样的数据[15], 通过这些数据对模型 进行修正. 这样得到的生成式模型对人类来说缺乏可解释性, 但是生成的样本却是人类可以理解的. 以 此推测, 机器以人类无法显式理解的方式理解了数 据并且生成了人类能够理解的新数据. 在 GAN 提 出之前, 这种从机器理解数据的角度建立的生成式 模型一般需要使用马尔科夫链进行模型训练, 效率 较低, 一定程度上限制了其系统应用. GAN 提出之前, 生成式模型已经有一定研究积 累, 模型训练过程和生成数据过程中的局限无疑是 生成式模型的障碍. 要真正实现人工智能的四个层 次, 就需要设计新的生成式模型来突破已有的障碍. 1.3 神经网络的深化 (责任编辑:本港台直播) |