昨日“人机对决”的硝烟还未散尽,今天上午 9 点 30 分DeepMind的掌门人哈萨比斯就在乌镇发表了《 AlphaGo 研发介绍, AlphaGo 意味着什么?》的主题演讲,将“怪兽”AlphaGo背后的重大升级细节和盘托出。不得不说,在经历了几番和人类选手的比拼之后,人工智能的力量已经进化的了难以想象的层次。 除此以外,在这次的论坛上,AlphaGo的主要开发者大卫·席尔瓦(David Silver)和谷歌大脑(Google Brain)团队负责人杰夫·迪恩(Jeff Dean)同时进一步揭秘了脱胎换骨之后的全新AlphaGo。 据悉,相较于之前12层卷积神经网络的AlphaGo,此次出战的AlphaGo已经达到的40层神经网络,性能较上次和人类大战60回合的Master也有了增强,更是比李世石的那一版强了三子的优势。正是在这种不断自我训练的情况下,AlphaGo已经生成了一代强过一代的神经网络。
图丨DeepMind团队预测,Master版本比李世石版本提升了三子 如今的AlphaGo无论从哪个角度看都更像是一台独立的高性能秘密武器。凭借着十个谷歌自研的TPU,它摆脱了对外界的依赖;使用自己所积累的数据;更强大的策略网络和价值网络提高了的反应速度和判断的准确性……强化学习的优势在AlphaGo身上表现得淋漓尽致,并且还将结出更加丰硕的成果。 以下是DT君在现场的编辑整理后哈萨比斯今日主题演讲的内容精选: 我先简单介绍一下 DeepMind。2010 年,DeepMind 创立于英国伦敦,2014年我们加入 Google。我们想要做的就是攻克人工智能。 对于 DeepMind 而言,我们希望网络全世界的机器学习科学家,能够结合计算能力,尽快解决人工智能的问题。另外,DeepMind 为了更好的进行研发,创新了我们的组织方式。
可以说,Deep Mind的任务可以分两步走: 第一步是要从根本上了解智能是什么,然后用人工方法去创造它。接下来就是要通过这种智能去尝试解决其他所有问题。我们认为,AI会是人类历史上最重要的技术发明之一。 具体来说我们会怎么做?在DeepMind,我们常会提到要建立通用型学习系统。最核心的概念就是“学习”,我们开发的所有系统都有学习相关的内核,这种学习系统从实践经验和数据中学习,而不需要预先输入程序化的解决方案。 第二步是要解决AI的通用性问题。我们认为,单一系统或者算法组合并不能直接解决各种问题,更不用说以前没遇到过的问题。这种系统最好的例子就是人脑,我们从某一任务中学习,并相关经验应用于其他未遇到过的问题,即所谓的举一反三。而机器在这方面是有很大问题的,DeepMind就是想赋予机器这种能力。 打造这种通用型学习系统涉及到几项关键技术。首先是深度学习,即层叠的神经网络,这个大家都很熟悉了;然后是强化学习,即让机器自己学习,以达到最大化的收益。 我们将这种具有通用目标的学习系统称为通用型人工智能,这与目前所谓的人工智能是不一样的,因为目前的人工智能主要还是预先写入的程序而已。 实际上,打造通用型学习系统,最重要的是要学习。所有算法都会自动学习,更多的数据和更多的体验不依赖于预设。 通用型的强人工智能与弱人工智能不一样。最好的例子就是,在90年代末IBM开发的“深蓝”系统,击败了当时顶尖的国际象棋高手卡斯帕罗夫——这在当时是很大的成就,但“深蓝”终究是一套预先写入程序的系统,相当于一位顶级程序员在和卡斯帕罗夫对弈,这位程序员尝试揣摩卡斯帕罗夫脑子里在想什么,并把相应的对策全部编写到程序里。这个技术了不起,但它不能解答人工智能之路在哪,只是在执行预先写入的命令,而不是自己来学习、决策。
然而,人类的大脑学到新的知识后却可以举一反三,我们可以用习得的现有经验解决新的问题,这是机器所不擅长的。 (责任编辑:本港台直播) |