根据启蒙老师李守胜的说法,“柯洁可以说还在娘胎里的时候,atv,就是听着围棋声长大的”。我们假设 1997 年出生的柯洁,从负一岁就开始下棋,每天 24 小时不眠不休,每局 4 小时,在整整 21 年中,也只能下不到 5 万局。 需要指出的是,人类对棋谱的利用率远超人工智能。职业棋手通过几十局棋谱,就能大致摸清对手棋路。人工智能却需要至少数以万计的棋谱,才有可能发现其中规律。 而且,并非数据“喂”得越多,下棋水平越高。输入海量数据后,人工智能仍不得法的情况也很常见。 不过,一旦找到了规律,人工智能就进步神速。AlphaGo 只用两年,就从零起步登顶世界第一,手下败将包括李世石、聂卫平、柯洁。 这次与柯洁对弈的 AlphaGo,也不同于去年大战李世石的版本。AlphaGo 有分布式版与单机版两个版本,去年与李世石对决,AlphaGo 还需动用分布式版全力以赴,开奖,今次只需单机版就能轻取棋艺更高的柯洁。两个版本的计算能力差距悬殊,单机版运行在 48 个CPU 和 8 个 GPU 上,分布式版运行在 1202 个 CPU 和 176 个 GPU 上。 或者说,对李世石是群殴,对柯洁是单挑。 2017年初,AlphaGo 化名 Master,在在线快棋对决中,横扫中日韩顶尖棋手,获 60 胜 0 负 1 平。唯一一次平局是因为对手掉线,比赛不得不提前终止。击败聂卫平后,代为执子的黄世杰博士在对话框中敲出“谢谢聂老师”。 柯洁有没有可能通过研究 AlphaGo 的棋谱找到对手的弱点呢?可能性非常小。时至今日,AlphaGo 的围棋下法已经超出了人类经验和理解力范畴。理论上,大家都知道,AlphaGo 是按概率下棋。但实战中,棋手猜不出 AlphaGo 下一步会怎么走,AlphaGo 却不仅猜得中,还算得出各种下法胜算几何。 数千年来,人类学习围棋的方式更多是依靠经验。这种经验可能来自前人棋谱,也可能来自长年累月的对弈训练出的“直觉”。 这种经验,既成就了柯洁,也束缚了柯洁。它让柯洁可以站在前人的肩膀上往更高处攀登,但也局限了他对围棋的理解和创新。 当看到 AlphaGo 下出棋论上的“臭棋”,却所向披靡时,柯洁便会发出文章开头那样的惊叹,认为人类几千年来在围棋上的所有积累都化为乌有了。 尽管柯洁试图跳出这种局限,但不论他研究 AlphaGo 的棋谱,还是和其他人工智能下棋,在 AlphaGo 强大的运算和预测能力面前,这样的努力都无异于大海捞针。 AlphaGo 的胜利,虽然难免给柯洁个人造成不快,但对更多人来说,体现的是意义非凡的技术进步。 如果把“寻找围棋的至高真理”看做一个悬疑千年未解的难题,将职业棋手和人工智能看做人类解决这个难题的不同尝试,AlphaGo 的胜利显然意义非凡,仿佛一百年前拖拉机的成功问世。
拖拉机的发明,让人类有了比马更高效的生产工具。上图显示了拖拉机出现后,美国农场 1910 年到 1960 年,拖拉机和马、骡子数量的增减对比。蓝色代表拖拉机,红色代表马和骡子 / 图片来源:Economic History Association 计算机科学家开发 AlphaGo,并不是为了给人类创造修身养性的工具,而是像谷歌研究总监彼得·诺维格所说,希望用人工智能解决人类自己也不知道如何解决的问题。 围棋是对抗类、回合制、无随机性的完全信息游戏,AlphaGo 的算法可以为具备同样条件的场景,提供解决问题的参考方案。
围棋的“无随机性”是指对手可以落棋的位置、手中的棋,以及开局以来到现在为止的所有棋盘信息都是已知的。扑克属于非完全信息游戏,有随机性,因为其他玩家手中的牌是未知的。 未来十年,如果具备精准决策能力的人工智能获得大范围的应用,金融、医疗、法律、交通、公共安全等领域都将发生翻天覆地的变化。 一年多来人类高手们的接连惨败,也许只是一个伟大故事的开头。 (责任编辑:本港台直播) |