编译:刘小芹 胡祥杰 AI复始,万象更新 ! 新智元祝广大订户鸡年大吉!
新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】Future of Life 网站采访了 Richard Mallah 和 Ian Goodfellow,讨论 AI 在过去一年取得的进步,以及对2017年的展望。 2016年,AI 取得了一些重要的发展。我们采访了 Richard Mallah 和 Ian Goodfellow,和他们一起聊一聊 AI 在过去一年所取得的进步。Richard 是 FLI(Future of Life Institute) AI 项目的主管,他是多家AI 公司的资深顾问,创建了获得最高评价的企业文本分析平台。Ian 是 OpenAI 的研究科学家,Deep Learning 一书的第一作者,同时也是生成对抗网络(GAN)的提出者。 Ariel:对我来说,2016年有两件事比较难忘。第一件是 AlphaGo 在3月份击败世界顶级围棋棋手李世石。AlphaGo 是谁?为什么这一成就如此让人难以置信。 Ian:AlphaGo 是 DeepMind 的围棋游戏系统。围棋是这样一种游戏:两位玩家轮流在棋盘上放置棋子,玩家需要尽可多地占领领地。但是,每次放置棋子,我们面临的选择都有成百上千次。用计算机来模拟一些不同的围棋游戏,并且弄清楚,这一游戏未来会如何发展,通常被认为是无法实现的。要做到这一点,计算机需要依赖于直觉,正如人类棋手看着棋盘,会得到一种被称为“第六感”东西,告诉他棋局对他是否有利,下一步棋该如何走。要精确地计算出每位玩家下一步棋该怎么走,从计算能力上来说,是不可行的。 Richard:DeepMind 团队有一个网络用于所谓的价值学习(value learning),另一个深层网络用于策略学习(policy learning)。从根本上看,所谓的策略指的是,下一步棋该怎么走。价值网络则是关于该状态有多好,也就是智能体(agent)获胜的概率大小。然后它们会执行蒙特卡洛树搜索,这意味着它有一些随机性和许多不同的路径:大约是数千的数量级。所以它更像是一个人在思考一些不同的行动,并试图确定这些动作的效果如何。 Ian:从2012年到2015年,我们看到了许多突破,其中最令人兴奋的是AI已经能够复制人的能力。但是到了2016年,我们开始看到的突破是,AI 开始超越人类的表现。AlphaGo 令人兴奋的部分是,AlphaGo 不仅学习如何预测一个人类围棋专家会做什么,它还通过自我对弈,来学习如何比人类最好的棋手做得更好。所以我们开始看到 ,AI 现在能做的事,比人类告诉计算机要去做的事还多。 Ariel:那么这将如何应用于我们将日常的交互应用程序中?我们怎样才能开始看到这些技术的影响? Richard:这些技术很多都是研究系统。他们不一定要直接进入产品化的管道,但它们正在帮助在AI系统和机器学习系统中隐含学习的模型,以获得更好的效果。 Ian:还有其他的策略,比如,生成和此前的研究类似的新研究,其中一个就是 WaveNet。这是 DeepMind 在2016年推出的语音生成模型。你给系统提供一句话,只需要把这句话写下来,你就能听到计算机把这句话读出来。WaveNet 可以创建一个听起来非常真实的音频波形,如人类发音一般。WaveNet 现在的主要缺点是它相当慢。它必须一次产生一个音频波形。我认为 WaveNet 需要两分钟才能生成一秒钟的音频,所以音频速度还不够快到支持交互对话。 Richard:类似的。我们也看到了用来为黑白照片上色、把素描变成逼真图像或者把文本转化成图像的应用。 (责任编辑:本港台直播) |