翻译:刘小芹 弗格森 【新智元导读】近日,从Open AI 重回谷歌大脑的 Ian Goodfellow 接受Wired 专访,这篇文章被Google+推荐为关于对抗生成网络历史和未来的绝佳文章。专访中,作者透露,作为2017年最火的一项深度学习技术,GAN 竟来自Goodfellow 在一次酒后与同行的争论。此外,回到谷歌以后,Goodfellow 将打造一个专门研究GAN 的团队。 理查德·费曼去世后,他教室的黑板上留下这样一句话:“我不能创造的东西,我就不理解。”(What I cannot create, I do not understand.) Ian Goodfellow 在解释他在 Google Brain 所做的研究时,引用了这位伟大的物理学家的这句名言,费曼是加州理工学院教授,同时也是畅销书作者。但 Goodfellow 指的不是自己,也不是 Google 内部的其他任何人。他指的是机器:“ AI 不能创造的东西,它就不理解。” Goodfellow 是世界上最重要的 AI 研究者之一,他在 OpenAI(谷歌大脑的竞争对手,由 Elon Must 和 Sam Altman 创立)工作过不长的一段时间,今年3月重返 Google Brain,建立了一个探索“生成模型”(generative models)的新研究团队。生成模型是创造照片、声音、以及其他现实世界的表征的系统。Goodfellow 将这些工作描述为通向各种各样的人工智能的重要途径。 “如果 AI 能够想象这个世界的现实细节——学习如何创造逼真的图像和逼真的声音——就能让 AI 得以学习现实世界的结构。”他解释说,“这能帮助 AI 理解它看到的图像或听到的声音。” 2014年,还是蒙特利尔大学的博士生时,一次在一家酒吧稍微喝醉与人争论,Goodfellow 设想了这样一种被称为“生成对抗网络”,即 GAN 的 AI 技术。虽然其起源有酒精的因素,但这是一个非常优雅的设想:一个 AI 能够创造出足以乱真的假图像,然后第二个 AI 分析其结果,并判断这些图像是真实的还是假造的。“你可以把它想象成一个艺术家和一个艺术评论家,”Goodfellow 说,“生成模型想要骗过艺术评论家——让艺术评论家认为它产生的图像是真实的。”由于第二个 AI 要识别出图像是假的非常困难,第一个 AI 学会了以这样的方式模仿真实的图像,而它独自是没法做到的。在这个过程中,这两个神经网络能够将 AI 推向计算机宣布完全脱离它们的人类老师的一天。 Facebook AI 研究主管 Yann LeCun 称 GAN 是“过去20年来深度学习方面最酷的想法”。深度学习是 AI 的一个子领域,它正在改变所有互联网大公司的方向,包括 Google,微软,Amazon,以及 Facebook。Goodfellow 的想法虽然尚未成熟仍在不断发展,但它们已经迅速在 AI 社区中广为传播。许多研究者,包括 LeCun,相信 GAN 能够达成“无监督学习”,这是 AI 研究领域的一个强烈愿景:不需要人类直接帮助的机器学习。 让 Goodfellow 冒出这个想法的酒吧叫 Les 3 Brasseurs,或称 The 3 Brewers。他的朋友 Razvan Pascanu,现在是 DeepMind 的研究员,当时刚完成博士学位,Goodfellow 以及其他许多朋友一起聚在那个酒吧为他庆祝。其中一位朋友说起一个新的研究项目,研究如何在数学上确定一张照片里的所有信息。他们的想法是将这些统计数据输入到一台机器,然后让机器自己创造照片。已经喝得微醺的 Goodfellow 说这永远不可能奏效,因为需要考虑的数据太多,没有人能够把所有数据记录下来。但这时,他想到了一个更好的方法:可以让神经网络去教会机器如何创造逼真的图像。 神经网络是一个复杂的数学系统,通过分析大量数据来学习任务,从识别照片中的人脸到理解对话,等等。在那间酒吧里,Goodfellow 想到在一个神经网络学会创造逼真的图像后,第二个神经网络可以当它的对手,j2直播,试图判断这些图像是否是假造的,然后,将这个判断输入给第一个网络。Goodfellow 说,通过这种方式,最终能教会第一个神经网络生成足以乱真的“假造”图像。 这随后引来了争论。Goodfellow 的朋友们同样坚持这种方法不会奏效。所以,当天晚上 Goodfellow 回家后,他就开始着手建这个东西。“我回到家时还是有点醉醺醺的,女朋友已经睡着了,然后我就坐在那里想:‘绝对是我的朋友们是错的!’”他回忆道:“然后我就熬夜用 laptop 写出了 GAN 的代码。”正如他的想法那般,代码在第一次尝试是就奏效了。“真的很幸运,”他说,“因为假如它第一次不工作,我可能就放弃这个想法了。” (责任编辑:本港台直播) |