当李开复博士召唤母校卡内基梅隆大学(Carnegie Mellon University)开发的德扑人工智能程序冷扑大师(Libratus),与“中国龙之队”对抗结束,宣布人类零胜惨败79万分时。“老东家”Google在4月10日同一天,选择北京天坛附近的中国棋院与中国围棋协会、浙江体育局正式宣布——AlphaGo2.0来中国了,与它有关的中国乌镇?围棋峰会将在5月23日-27日在乌镇举行。 发布会明确了AlphaGo2.0与围棋现排名世界第一的柯洁九段进行三番赛对弈(此前都是五番赛),这一从去年夏天就“被谣言”的消息,终于在各方的期待中变为了现实。 AI进化者:AlphaGo、Master、AlphaGo2.0 和“机器人圈”类似的人工智能(AI)和机器人领域的从业者,都对2016年3月李世石与AlphaGo的对决印象深刻。这场“人机大战”让AI从幕后走向了台前,几乎每一位地球人都意识到了AI的发展已经走进了日常生活,未来,还将颠覆我们的生活。 追根溯源,AlphaGo是一款由Google旗下DeepMind团队研发的围棋人工智能程序。“破解智能,用它来让世界变得更好”是打开DeepMind官网后,清晰可见的口号,DeepMind公司早在2014年就以4亿英镑的价格被谷歌收购,今时今日仍是Google截至目前在欧洲地区的最大收购案。而在Google之前,包括特斯拉创始人马斯克、Facebook创始人扎克伯格在内的许多硅谷大佬们也都曾向DeepMind抛出过橄榄枝。 人工智能程序AlphaGo首次被大众熟知是在2015年,因其在没有让子的前提下以5:0击败中国旅欧职业棋手、欧洲冠军樊麾。 随后,AlphaGo以4:1战胜世界围棋名将李世石,这场被称为全球顶级“人机大战”的对抗中,AlphaGo的实力首次被世人真正认可。 但是,围棋界人士也表示,李世石心态上准备不足,在比赛中未必发挥出真实的最高水准。 DeepMind创始人Demis Hassabis在赛后也表达,希望AlphaGo能与中国的高水平棋手对弈,比如柯洁。但因为种种原因顶尖对决被推迟,这才有了文章前Demis Hassabis的辟谣。 AlphaGo在未能“华山论剑”的时间里,江湖还是有它的各种传说,比如“化身” Master标注为韩国九段,在围棋网站弈城与野狐上不断发起挑战,先后击败了包括世界冠军常昊、时越、芈昱廷、唐韦星、古力在内的诸多好手,以及“韩国第一人”朴廷桓与“日本第一人”井山裕太都败北。世界排名第一的柯洁也在与Master的对抗中败下阵来。直到最后,Master宣布自己就是AlphaGo,而代为执子的就是AlphaGo团队的黄士杰博士! 在结束了Master的测试后,DeepMind团队于在1月下旬宣布推出新版“AlphaGo”,也就是这次来中国的AlphaGo 2.0。这一版本的升级亮点是——摒弃人类棋谱,即仅通过监督学习和强化学习,再度进化出新的“围棋机器人”。 柯洁将遭遇一个全新的、更强大的对手。 AlphaGo是来自“未来的人”。我会尽我全力去对决。我站在了历史变革的节点,不会说:输了无所谓。不管它有多强大,我都不会言败。——柯洁说 AlphaGo为什么能不断赢? AlphaGo下围棋的原理和人类有相似之处,一是判断局部,二是把握全局。DeepMind在Nature杂志上发表过一篇论文,有过比较细节的介绍。 AlphaGo总体上由两个不同功能的“大脑”即深度神经网络组成:策略网络(Policy network)和价值网络(Value network)。 对弈中,AlphaGo的两个“大脑”协同工作。策略网络将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络,对自我对弈进行预测,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器。然后,AlphaGo将这两个“大脑”整合进行基于概率的蒙特卡罗树搜索(MCTS)中,做出最终的决定。 (责任编辑:本港台直播) |