正如赛前很多人预料的那样,在与 AlphaGo 的第一场围棋对战中,柯洁输了。
不过,也正如爱范儿(微信 ID:ifanr)在昨天比赛结束之后一分钟内发布的总结文章所言,AlphaGo 已经今非昔比。确切地说,无论是 DeepMind 对它的命名,还是它背后的计算力量,乃至它自身的棋力,都发生了脱胎换骨的变化。 5 月 24 日,赶在第一局比赛结束之后,DeepMind CEO Demis Hassabis 在第二天举行的中国乌镇人工智能高峰论坛中,专门谈到了 AlphaGo 背后的研发过程和对战故事,以及对这次比赛中 AlphaGo 的相关问题进行了解读。
Hassabis 首先对 DeepMind 进行了简单介绍,然后开始谈起 AlphaGo 背后的复杂性。他表示,计算机下围棋之所以异常困难,是因为围棋的复杂程度让穷举搜索都难以解决;由此衍生出两项难题:一是不可能写出评估程序以决定谁赢,二是搜索空间太过庞大。 而在具体的 AlphaGo 研发过程中,DeepMind 更是要考虑直觉和计算的问题;因为围棋是一种独特的游戏,它具有以下特征: 围棋不像象棋等游戏靠计算,而是靠直觉。 围棋中没有等级概念,所有棋子都一样。 围棋是筑防游戏,因此需要盘算未来。 小小一子可撼全局。 “妙手”如受天启,j2直播,玄妙深奥。
2016 年 3 月,AlphaGo 与韩国围棋选手李世乭九段进行了举世瞩目的“人机大战”,最终以 4:1 的比分获胜;其中,AlphaGo 在第二局中下出了令人惊叹的第 37 步棋,不过在第四局中也被李世乭的“神之一手”所困扰。
Hassabis 介绍说,AlphaGo 与李世乭之间的对决,对围棋本身的影响是多个层面的。首先是体现的围棋的影响力上,这次对决拥有 2.8 亿观众和 3.5 万篇报道,并且推动围棋棋盘的销售量增加了 10 倍,让不少西方人开始关注这项来自东方的古老技艺。 但 AlphaGo 给围棋带来的真正改变在于思维方式的启发;李世乭在赛后表示: 我认为这给围棋引入了新思路,我感觉找到了自己下棋的理由。
对于 DeepMind 团队来说,AlphaGo 与李世乭的对战也让他们对 AlphaGo 有了新的判断。Hassabis 表示,AlphaGo 在与李世乭的对决中,不仅仅表现出了它应有的认知能力,甚至已经表现出了一定的创造力,虽然是非常有限的。 在 2017 年元旦前后,AlphaGo 以 Master 的身份与包括柯洁在内的 60 名人类顶尖高手进行了对战,并全部获胜。Hassabis 表示,在这 60 场对决中,AlphaGo 表现出了更强的创造力,尤其是在它与辜梓豪和朴廷桓的对决中。 赛后,柯洁表示: 人类数千年的实战演练进化,计算机却告诉我们人类全部都是错的,我觉得,甚至没有一个人沾到围棋真理的边……我们棋手将会结合计算机,迈进全新的领域达到全新的境界……人和 AI 应该可以趋近围棋真理。 在 Hassabis 的演讲之后,AlphaGo 团队负责人 Dave Silver 上台揭露了 AlphaGo 的更多细节。
Silver 表示,其实与李世乭对战的版本的全名为 AlphaGo Lee,它在 Google Cloud 上使用了 50 个 TPU(全称为 TensorFlow Processing Unit,是Google 为了加速深层神经网络运算能力而研发的芯片);而 Master 的全名为 AlphaGo Master,它实际上是运行在单个 TPU 机器上,它的强大之处在于能够从自我对弈中强化学习,同时也使用了更强大的策略&价值网络。
实际上,在 AlphaGo 团队的评估中,AlphaGo Lee 的等级分为已经在 3500 分和 4000 分中间,而 AlphaGo Master 的等级分已经超过 4500。作为对比,当今世界排名第一的柯洁在 GoRatings 的等级分为 3620。
(AlphaGo 各个版本的评估分)
(AlphaGo 已经被踢出评估体系) (责任编辑:本港台直播) |