在今天的比赛中,柯洁也以其人之道还治其人,在极早期就下出了三三点角的手段,这也是AlphaGo(和Master)之前对人类棋手常见的布局。有意思的是,AlphaGo在面对自己的方法时,也没有上当,而是下出了也很少见的小飞守角。 最后,AlphaGo的下棋速度大大增加了,可能是因为程序经过了优化。和李世石对弈时多次进入读秒阶段相比,本次比赛AlphaGo只用了一个多小时。相当于下了一盘30秒不到的块棋。这也从侧面说明计算机进一步拉大了和人类之间的差距。 去年是分布式实施,今年有一个更先进的算法,运算更快,和去年相比,这一版AlphaGo可以说是单机版。 ——DeepMind团队 根据DT君的了解,早在比赛之前,就有传言称此次出战的AlphaGo已经和击败李世石的那只完全不同:AlphaGo采取了一种全新的算法,开发人员没有给它“喂”任何人类棋谱,它的走法单纯靠自我对弈训练出来。在2016年的人机大战中,李世石曾疑似击中过AlphaGo的bug而扳回一局,而这一次,显然AlphaGo没有再犯同样的错误。 而谈到AlphaGo的创新之处,DeepMind团队的代表Lucas Baker和樊麾给出了详尽的解释,他们总结了AlphaGo最近在对局中使用的战略和战术创新,以及这些招法所展现的关于围棋的一些新认知。 AlphaGo 的棋风 AlphaGo最强大的地方,并不体现在具体某一手棋或者某个局部变化中,而是它在每一局棋里所展现出来的独特视角。虽然AlphaGo的棋风本身并不容易总结,但是总体来说,AlphaGo更倾向于使用一种自由、开放式的行棋风格。 在它的世界里,没有什么先入为主的概念,也没有什么必须要遵守的规则,这让它得以打破常规,发现当前棋局中最高效的一手。在接下来的两局棋里,AlphaGo这种独特的对局哲学,常常让它下出违反第一感、但却极具威力的一手棋。 虽然围棋是围地盘的游戏,但事实上最具决定性的部分在于如何平衡棋盘上的各个局部。在这一点上,AlphaGo展现出了卓越的能力。尤其值得一提的是,AlphaGo对于外势的把控可以说到达了出神入化的地步,具体来说,它可以近乎准确地判断棋盘上现有棋子能给周围区域带来多大的影响力。 虽说棋子的影响力本身很难衡量,但是AlphaGo强大的价值网络让它能够把棋盘上所有的棋子当作一个整体来考虑,因此它的判断几近精确。AlphaGo的这种能力,使得它能够把局部棋子的影响力,转变为全局的优势。 本局,黑方(AlphaGo)实空很少,白方占了三个角,但是黑方全局外势较为可观。特别是图中三角形标记的交换,一方面帮助白方加强了左上角实地,同时也扩张了黑方的大模样。通常,棋手们不愿意做这样的交换,因为白方得到的是显而易见的实地,而黑方所得还有很大不确定性。但是AlphaGo结合了精确的判断以及对于风险的把控,使得这一手棋成为可能。 不过,对于外势价值的判断完全取决于当前局面,如果外势的价值可能被削弱,AlphaGo也会自愿放弃外势。在上图的对局中,AlphaGo最为令人震惊的几手棋,出现在右侧的六子二路连爬。 围棋有一句棋谚:四路外势线,三路实地线,二路失败线。AlphaGo的这几招棋粗看之下正应了这句棋谚,因为这几手交换让白棋变强的同时还拥有了外势,而黑棋仅仅在边上围住四目实空。 大多数棋手以图中这样的二路连爬为耻,因此会在第一时间否定这种下法。然而,AlphaGo判断如果能用这些交换将白棋的棋子分断,之后再通过对于白棋几块棋的攻击,慢慢将白棋获得的外势侵消掉,这种下法更利于确保优势。 新手、新型 Alphago近期也弈出了一些布局阶段的新手,其中最有代表性的当属开局的点三三和妖刀定式的新变化。两者都打破常规,并且在更深入的研究后得到认可。 开局点三三 围棋中最注重实地的定式之一,无疑是角部的点三三定式: 这种下法能够快速占据角部地盘,但是传统围棋书都将这个定式归类为不适合开局阶段使用,因为它给予对方太多外势: AlphaGo的创新在于它省略了有三角形标记的这些交换,使角部保持了未完成的形态: (责任编辑:本港台直播) |