极客公园微信号:geekpark 德州扑克 编者按:今年一月,在美国宾夕法尼亚州匹兹堡的 Rivers 赌场,由卡内基梅隆大学开发的 Libratus 人工智能系统击败了人类顶尖玩家。这是继去年 AlphaGo 在围棋领域横空出世之后,人工智能在此类游戏中对人类的又一次打击。 而在这背后,人类其实已经尝试用机器人打扑克很久了,Bloomberg 的这篇文章(https://www.bloomberg.com/news/articles/2017-01-31/inside-the-20-year-quest-to-build-computers-that-play-poker)也许能帮我们更好地了解这背后的故事。原文标题为 Inside the 20-Year Quest to Build Computers That Play Poker,其中略有删节。 世界上最好的职业扑克选手中的 4 位在一月的时候在匹兹堡参加了一项比赛,然而他们输了。他们每天早上 11 点出现在电脑前,穿着运动裤和球鞋,玩的是 1500 手的一对一无限下注德州扑克,然后一直玩到晚上,这意味着他们每天的比赛时间超过 10 个小时。在一天的过程中,咖啡和水瓶都堆放在玩家的键盘旁边,而吃的 Chipotle 袋子则散落一地。 每当这些玩家发出一个动作,它就会被传送到位于 5 英里外的卡内基梅隆大学处的计算机服务器上。在那里,一个信号将再旅行 12 英里到他们的对手——一个名为 Libratus 的软件处,它运行在位于郊区的匹兹堡超级计算中心。Libratus 一次发出 8 个动作——每个对手应对两个。它刻意把自己的速率降低,这让它的人类对手们有点蛋疼,其中一位 Jason Les 表示:「这让一天的时间变得更长了」。在 Les 这位运动男看来,「等待确实不应该影响我,但有时就像是,『好吧,这还有完没完了?』」 Libratus 当然不需要休息,但它和人类选手的区别还多着呢。当赌桌上的赌注金额变大时,人类会思考更长的时间,而计算机则恰恰相反,直播,它会在金额更小时玩得更慢,因为需要它浏览的可能性变得更多了。Libratus 也倾向于做出巨额的、突然的赌注,通过把钱不规律地投入场中,它也经常违反所谓的标准化赌博规则。 从人类玩家的角度来看,这样的行为是刺激且鲁莽的,从长远来看也代价高昂。但 Libratus 作为一个扑克选手的主要属性就是它没有人类的那些特质。当 20 天的比赛在周一结束时,人类已经损失了 180 万美元。Tuomas Sandholm 和 Noam Brown 这两位来自卡内基梅隆大学的计算机科学家开发了 Libratus,他们为计算机第一次在这项世界最顶级的扑克大赛中击败人类开始欢庆。 人工智能专家们一直将这些游戏作为开发和测试的工具,在此之前,计算机已经在国际象棋、跳棋、西洋双陆棋和围棋中击败了人类。扑克则有些不同,因为几率的原因,也因为你不知道你的对手拿的是什么牌。这种所谓的不完美信息类游戏需要那种人类的智能——比如欺骗对手和体察到对手在欺骗自己——而这是计算机所缺乏的。
Noam Brown 在过去五年中一直在开发 AI 应用程序来破解扑克这项游戏。 「无限制德扑就是你看到的这项游戏,它甚至更被称为是一项艺术而非科学」,《完美的赌注》这本书的作者 Adam Kucharski 说道,「人们长久以来也觉得这项游戏暂时不会被机器染指。」 然而上面这种想法在最近几周破灭了。在 1 月初,阿尔伯塔大学的研究人员发表了一篇论文,他们研发的一个名为 DeepStack 的 AI 程序击败了 11 名专业的扑克玩家。DeepStack 能否击败 Libratus 还存在争议,Sandholm 觉得自家 AI 击败的人类选手要比 DeepStack 的更强,而阿尔伯塔大学计算机项目的负责人 Michael Bowling 也承认了这一点,但他同时也认为人类在持续玩了一个月游戏时是否还处于最佳状态有待商榷,并且 DeepStack 的胜率是 Libratus 的三倍。 但无论如何,这两位都认为 AI 在扑克领域跨过了一个重要门槛。对他们来说,这与扑克这项游戏没什么关系,德州扑克只是他们为自己的 AI 程序寻找合作伙伴的一种方式,而由此得到的收获将回馈到诸如网络安全这样的具体应用当中。「我们的主要基准是在这个项目打败人类,但这些算法不仅仅是为了扑克」,Sandholm 说道,这位长相酷似盖茨的科学家曾经是世界上排名最高的风帆冲浪运动员,「它们的目标是通用。」 (责任编辑:本港台直播) |