独家专访“AlphaGo之手”黄士杰:机器是没有感情的,而我会微笑 : ) 来源:麻省理工科技评论 原标题:独家专访“AlphaGo之手”黄士杰:机器是没有感情的,而我会微笑 : ) 早在上世纪 60 年代,就已经有人开始对围棋的计算机程序进行研究。当时还在威斯康辛大学麦迪逊分校读计算机博士的 Albert Zobrist 引入了影响函数(influential function),为棋盘的每个空位计算数值,从而划分黑白领域并为每个子的影响力打分。
图丨w:白子影响函数;b:黑子影响函数;m:相互影响函数 1972 年,密歇根大学的Walter Reitman 和 Bruce Wilcox 开始把人工智能研究应用于围棋。 从上世纪 80 年代末起,中国科学家也在相关领域做过一些工作,其中影响力最大的是陈志行和他的围棋程序“手谈”。从 1994 年到 1997 年,“手谈”在两个重要的国际计算机围棋比赛应氏杯和 FOST 杯中共获得了六个冠军。 进入 21 世纪后,机器学习技术和蒙特卡罗树搜索等方法开始被大量引入围棋程序中,也让围棋人工智能出现了飞跃。 2004 年,法国的B Bouzy 和 B Helmstetter 发表论文,在评估某个行棋位置的时候,他们让自己的蒙特卡罗围棋程序随机选取一些点,并以此为基础完成一定数量的棋局,从而计算某个点引发的棋局最终结果的平均分数。
图丨蒙特卡罗树搜索 在此基础上,法国计算机科学家 Rémi Coulom 开发出了围棋程序 Crazy Stone。2008 年,Crazy Stone 在被让 8 子的情况下战胜了职业棋手青叶熏四段——这是计算机首次在让 9 子之内战胜职业棋手。 在那时,直播,Rémi Coulom 也曾经指导了一名台湾师范大学的博士生,他叫做黄士杰。他从小学习围棋,属于围棋业余六段选手,还曾在台湾师大读书期间创办过围棋社,并获得大专杯围棋赛冠军。
图丨黄士杰的博士论文 在读硕士期间,黄士杰就将围棋定为他的研究课题。为了写程序,黄士杰有时在实验室一待就是十几个小时。他甚至还为了延续自己的研发成果而推迟两年毕业,最终,功夫不负苦心人,他设计的程序不仅获得了 19 路电脑围棋金牌,更是击败了当时最强的围棋程序 Zen。 在当时,这名计算机专业博士提出了一些新的蒙特卡罗树搜索的启发式算法,包括应用了模拟平衡算法(Simulation Balancing)和时间控制方法,极大地提升了程序的棋力。黄士杰用自己妻子的英文名 ERICA 给程序命名。 不过,这些程序都没有达到职业水准。性能最好的 Crazy Stone 和 Zen 也只达到了业余 5 段的水平。在那个时候,围棋界一般认为,计算机战胜职业围棋选手的那天还远远没有到来。
图丨围棋程序Crazy Stone 2012 年,在加拿大阿尔伯塔大学做了一年博士后研究员后,黄士杰加入了英国的人工智能创业公司 DeepMind。当时 DeepMind 创建刚刚两年,创始人是Demis Hassabis,Shane Legg 和 Mustafa Suleyman,早期投资人包括 Elon Musk、Peter Thiel 的 Founders Fund、以及李嘉诚的 Horizons Ventures。 2014 年 1 月,谷歌以 5 亿美元的价格收购 DeepMind,那时的 DeepMind 尚未发布任何一个产品,只有一篇还没有发表的论文。当时,黄士杰名列公司内两位首席工程师之一。 DeepMind 早期希望通过机器学习和系统神经生物学理解智能。2014 年 10 月,公司发布了一款原型产品,可以让计算机模拟人类大脑的短期记忆功能。
图丨Demis Hassabis、David Silver和黄士杰 2014 年,DeepMind 组建了 AlphaGo 项目,用来检测使用了深度学习的神经网络能否应用于围棋。公司的科学家通过增强学习让 AlphaGo 自己下了数千盘棋,矫正模型。 随后,AlphaGo 又与 Crazy Stone、Zen 等围棋程序下了 495 盘棋,只输了 1 盘。为了增加难度,AlphaGo 又与 Crazy Stone,Zen 和 Pachi 下了让四子棋,胜率分别为 77%、86%和99%。 2015 年 10 月,AlphaGo 随后以 5:0 的比分完胜欧洲冠军樊麾二段,这是计算机程序第一次在正式比赛中战胜人类职业选手。
图丨AlphaGo完胜樊麾二段 (责任编辑:本港台直播) |