还有其他类似实验在较少受控的环境中进行。自从科学家在实验室建立它们以来,扑克机器人就一直在进行在线赌钱的游戏。它们历来只玩低赌注游戏并从来没有被认为是老手。但是赌博行业分析师和在线扑克行业报告的发布商Chris Grove说,扑克机器人正在向更高赌注的竞赛中传播。 “如果你是一个在线扑克运营商,这很可能是你的头号欺诈忧虑,并且可能对相当大的利润空间产生影响,”他说。 扑克产业和学术扑克界已经悄然合作多年, 每个参与的人都对细节闭口不谈。 但是商业扑克机器人制造者和试图打击他们的人都密切关注学术工作的进展。 Bowling几个的以前的弟子已经去为在线扑克公司打工,并且至少有一个在销售用于在线博彩的机器人。 在扑克行话中,可以代替你玩游戏的程序被称之为“梦境机器”。在线论坛的参与者交换关于何时的可疑活动可能说明你在跟机器人对战 - 或关于他们如何制作自己的扑克机器人的"战争故事"。 加拿大博彩公司Amaya旗下的扑克之星游戏平台(PokerStars),专门雇用70人打击这种欺诈行为。 这些反欺诈员工直接联系可疑玩家并要求他们描述在某手牌上所采取的策略。 该公司还会向可疑玩家发送电子邮件,要求制作360度视频以显示其周围环境,随后玩超过一个小时的游戏,并且在整个过程中手和键盘要确保完全可见。 机器人不必拥有丰富的扑克游戏技巧就可以从游戏运营商那里获得盈利- 这对整个行业是危险的。一个程序通过榨取普通玩家而获得一定利润可能就会让人铤而走险。但是位于英国的在线游戏公司Gamesys的扑克策略主管Darse Billings说,实际上“梦境机器”和学术界所研究的AI使用不一样的技术,并试图解决从根本上完全不同的挑战。 打败低端玩家的程序并不仅仅是一个打败精英玩家程序的简化版本, 这是两个完全独立的问题。 Billings 比任何人都了解这两种扑克领域。 他在20世纪90年代获得计算机科学硕士学位,然后成为一个职业扑克玩家,以偿还学生贷款。 几年后,他回到学校与阿尔伯塔大学(University of Alberta)的计算机科学家Jonathan Schaeffer合作,其最出名是编写了可以完美进行国际跳棋比赛的软件。 Billings说服Schaeffer下一步专注于扑克。 为解开国际跳棋的问题,Schaeffer使用了一种基本上试图在任何情况下都计算最佳移动的方法,而并不去考虑到那一步发生了什么。但把每一步视为一个孤立问题在扑克这样的游戏中是没有意义的,因为这里涉及运气,而且并不是每个人都能获取到完整的信息。阿尔伯塔大学的研究人员开始制定一个整体战略,这需要采用在博弈理论中被称为纳什均衡(Nash equilibrium)的策略 --这是一种应用于双人博弈的方法,从长期来看不管对手做出什么反应都不会有损失。 纳什均衡并不是一个理想的游戏风格。 在扑克游戏中执行均衡战略的关键是打出最强和最有潜力的一手牌的同时还保持不可琢磨。“当你赌上你最强的一手牌的时候还是需要一丝谨慎的,”Billings说。该团队开发了一个谨慎风格的AI,被称为Pink先生,而另一个AI是积极进取风格,被称为Agent Orange。很难描述一个计算机程序的所作所为,这听起来不像你谈论的东西却实际上是你所思考的。 均衡策略吸引了阿尔伯塔大学的Bowling,其专长是博弈理论,并在2003年开始应用于扑克领域。Sandholm,作为卡内基梅隆大学Bowling的论文委员会一员,在接下来的一年转向扑克领域,开奖,采取了类似的方法。 Sandholm和Bowling从2006年开始共同举行年度的计算机扑克比赛,定期对顶尖的人类玩家。 撇开他们这种竞争关系,实验室一直在关注彼此的研究成果。 这两个项目在过去几年大幅进化到了最终阶段。 在2015年1月,Bowling的团队发表了一篇文章,显示它如何解决有限德州扑克单挑玩法--一种比无限制德州扑克简单的双人扑克游戏,因为玩家可以限制投注。 Sandholm和Brown(在过去五年里一直在扑克AI领域上与他一起工作的博士学生),在几个月后在大河赌场举行了他们第一次“人脑 vs AI”比赛。他们的机器,起名为Claudico,对抗四名职业玩家,在打了超过8万手牌之后损失了$ 73.2万。 Sandholm说,比赛势均力敌可以称之为平局,但至少有一个玩家对此表示有异议。 (责任编辑:本港台直播) |