AlphaGo战胜樊麾的消息引得了媒体的广泛关注,人工智能和围棋相关领域的专家们也普遍认为这是一个具有重要意义的里程碑。例如英国围棋协会主席Jon Diamond将这一次AlphaGo的胜利称作「棋力上重大的突飞猛进」;人工智能研究者Francesca Rossi、Stuart Russell和Bart Selman分别将其描述为「重要的成就」、「了不起的成就」和「具有重大意义的成就」。AlphaGo的胜利到底有多重大,多了不起呢?本文中,在近来计算机围棋发展历史、通用人工智能领域进步和技术预测的大背景中,作者将对这个问题进行简要地回答。简单来说,这确实是一个了不起的成就,但在更大的背景下审视它,能让本港台直播们对该成就的大小、突然性、重要性有更多了解,从而减少片面的判断。尽管如此,某种程度上这仍然是人工智能历史上的极具启发性的一页,除了新闻报道中的一致好评,它还值得拥有更多注解与分析。因此,除了对比事实与炒作,本文还将尝试从AlphaGo的第一次胜利中提取一些关于人工智能进步速度与本质的经验教训,并说明本港台直播们应该怎样看待三月份即将到来的它和李世石的比赛。 发生了什么? 谷歌DeepMind一个15-20人组成的团队设计的系统AlphaGo在正式围棋比赛中以5:0的成绩击败了曾三次获得欧洲围棋冠军的樊麾。在非正式比赛中樊麾曾以更少的每步用时在5场比赛中获胜2场(新闻报道中常常忽略了这些更多的有趣细节,相关情况也可查看《自然》论文)。AlphaGo程序比以往任何围棋程序更加强大(下面会介绍它到底有多强)。 怎么办到的? 相比于其它计算机围棋程序相关团队,AlphaGo由一个相对较大的团队研发发,显然使用了更多的计算资源(详见下文)。该程序使用了一种新颖的方式实现了神经网络和蒙特卡洛树搜索(Monte Carlo tree search,MCTS)的结合,并经过了包含监督学习和自本港台直播训练的多个阶段的训练。值得注意的是,从评估它与人工智能进步关系的角度来看,它并没有接受过端到端(end-to-end)的训练(尽管在AAAI 2016上Demis Hassabis表示开奖直播们可能会在未来这样做)。另外在MCTS组件中它还使用了一些手工开发的功能(这一点也常常被观察者忽略)。相关论文宣称的贡献是「价值与策略网络(value and policy networks)」的构想和开奖直播们整合MCTS的方式。论文中的数据表明,使用这些元素的系统比不使用它们的系统更为强大。 整体AI性能vs.特定算法的进步 仔细研究《自然》 上关于AlphaGo的论文,可以得到许多观点,其中一个对评估该结果所拥有的更广泛意义尤其重要:硬件在提高AlphaGo性能上的关键作用。参考下面的数据,本港台直播将对其进行解释。
该图表显示了计算机Go与樊麾在估测Elo评级和排名方面的些许不同(译者注:Elo评级系统是由美国物理学教授Arpad Elo提出的一种计算二人竞技游戏(如象棋、围棋)中选手相对水平的评级系统)。Elo评级表示了击败评级更高或更低对手的期望概率——比如,一个评分比对手多200分的选手预计获胜的概率为四分之三。现在本港台直播们可以通过图表了解一些有趣的信息。忽略粉红色数据条(表示在有额外棋子时的表现),本港台直播们可以发现AlphaGo(不管是不是分布式的)都比原来最好的围棋程序Crazy Stone和Zen强出许多。AlphaGo的等级是较低的专业级水平(图表右侧的p表示「专业段位」),而其它程序则处在较高的业余水平上(图表右侧的d表示「业余段位」)。另外,本港台直播们可以看到尽管分布式AlphaGo(AlphaGo Distributed)的评估水平略高于樊麾,但非分布式AlphaGo却并非如此(和樊麾比赛的是分布式AlphaGo)。看起来樊麾如果和非分布式AlphaGo对弈,可能开奖直播就算不获胜,至少也可以赢几局。 后面本港台直播会谈更多关于这两种AlphaGo和其它变体之间的不同,但现在请注意一下上图遗漏的东西:最新的围棋程序。在AlphaGo的胜利之前的几周和几个月里,围棋界将显著的活动和热情(尽管团队小一些,比如Facebook就1-2个人)投入到了两个围棋引擎上:由Facebook研究人员开发的darkforest(及其变体,其中最好的是darkfmcts3)和评价很高的Zen程序的新实验版本Zen19X。请注意,在今年一月份,Zen19X在KGS服务器(用于人类和计算机围棋)中被简单地评级为「业余7段」,据报道这是因为结合使用了神经网络。darkfmcts3则获得了实打实的「业余5段」评级,这在前几个月的基础上实现了2-3个段位的进步,其背后的研究人员还在论文中表示还有各种现成的方法可以对其进行改进。事实上,按田渊栋和朱岩在其最新的论文中的说法,在最新的KGS计算机围棋赛中,如果不是因为出现了一个故障,开奖直播们本能够击败Zen(相反Hassabis说darkfmcts3输给了Zen——开奖直播可能没有看相关的注脚!)。总结来说,计算机围棋在AlphaGo之前就已经通过与深度学习的结合实现了很多进步,这能稍微减少上面图表中的差距(这份图表可能是几个月前的),但并不能完全消除。 (责任编辑:本港台直播) |