译者:王楠、胡祥杰、刘小芹 【更正说明】《财富》原文发布之处内容有误,现其网站已将错误更正,文中“从感知机到 AlphaGo,你知道的和不知道的深度学习”这一小节,事实应为:最初的革命火花开始于 2009 年。那年夏天微软的 Li Deng 邀请了神经网络先驱、多伦多大学的 Geoffrey Hinton 来参观并合作。钦佩于 Hinton 的研究,Li Deng 的团队用神经网络做了大量语言识别方面的实验。微软的 Peter Lee说:”我们对结果非常震惊,我们得到了比原型高 30% 的准确率。” 原文最初发布时,将内容错误地处理为:那年夏天微软的 Lee 邀请了神经网络先驱,多伦多大学的Geoffrey Hinton 来参观。钦佩于 Hinton 的研究,Lee 的团队用神经网络做了语言识别方面的实验。Lee说:“我们对结果非常震惊,我们得到了比原型高 30% 的准确率。” 现新智元也更正译文并重新发布, 特此声明。 点击阅读原文,可在爱奇艺观看全程回顾。以下是开场视频。 【新智元导读】《财富》封面文章报道深度学习推动的人工智能如何在整个计算生态系统引发革命。文章从深度学习发展的历史关键点入手,介绍重大的标志性技术突破,讲述了 Hinton、LeCun、李飞飞、吴恩达等研究者的故事,以及围绕技术和人才在谷歌、Facebook、微软、百度这些大公司之间展开的角逐。这篇文章可能是近期对深度学习最好的总结及介绍,也是深度学习已经跃居世界主流舞台的最好证明。 过去四年来许多领域的技术都取得了跨越性的发展。其中,最引人瞩目的是智能手机的语音识别功能比以往有了显著提升。当我们用声音命令手机给另一半打电话时,我们能够与他们取得联系,手机没有再将电话错拨给陌生人或已经不在一起的那个人。 实际上,我们现在越来越多地通过对话与计算机互动,无论是亚马逊的 Alexa、苹果的 Siri、微软的 Cortana,还是谷歌许多产品中的语音反馈功能。中国搜索巨头百度表示,使用语音界面的用户在过去 18 个月翻了三倍。 机器翻译和其他语言处理也有了长足的发展,谷歌、Facebook、微软和百度每个月都有新功能发布。谷歌翻译现在能提供 32 种语言对的语音翻译(输入是语音输出的也是语音),提供包括宿务语、伊博语、祖鲁语在内的共 103 种语言的文字翻译。谷歌邮箱应用有 3 种现成的自动回复。 接着要说的当时图像识别方面的进展。还是上面那 4 家公司,都有产品供你搜索或自动组织没有明确标签的照片。你可以要求系统显示所有带有狗的照片,或者有雪的,甚至抽象些比如含有拥抱场景的。这些公司都有研发中的产品,可以自动生成一句话那么长的图说。 深度学习推动计算产业逼近新的拐点 试想,要搜集含有狗的照片,应用程序必须识别出从吉娃娃到德国牧羊犬这么多种类的狗,还不能因为小狗上下颠倒或左边右边被雪被雾遮住了一块就被骗过。同时还要排除狼和猫。只靠像素。这究竟是怎么做到的? 图像识别技术的发展影响之深,已经远不止在你手机上很炫酷的社交应用。医疗初创公司声称,他们马上就能用计算机分辨 X 光片、MRI 和 CT 扫描图片,而且比放射学家读得更准更快,上至诊断预防癌症,下至加速发现治病救命的新药。更好的图像识别技术对于机器人、无人机以及自动驾驶汽车而言也是至关重要的。自动驾驶汽车在今年 6 月登上了本刊的封面报道。福特、特斯拉、Uber、百度和谷歌的母公司 Alphabet,都在公路上测试自动驾驶的原型样车。 但大多人没有意识到的是,所有这些突破实际上都是一样的。它们都受益于人工智能技术当中的深度学习,或者用大部分研究人员爱用的词形容——深度神经网络。 关于神经网络最不可思议的事情是,没有人曾经编程让计算机去执行这些任务。实际上,没有人能够做到这一点。程序员不再编程,而是提供给计算机一个学习算法,然后用海量的数据去训练它,这一过程会使计算机自己学会如何分辨需要分辨的物体、单词或句子。 一句话,这样的计算机可以自己教自己。用图像处理器巨头英伟达 CEO 黄仁勋的话说,“本质上说就是让软件写软件”。英伟达在大约 5 年前便看准深度学习,对这项技术做了大力投资。 (责任编辑:本港台直播) |