一面是学术性质的竞争分享,一面是大量的企业资金,二者结合,刺激AI迅速发展。有了谷歌资金的支持,研究人员开发AI打败了围棋职业高手。 AI是如何工作的? 从匹兹堡的扑克比赛中我们可以看到AI与人类的距离正在缩小。人类与AI竞争,同时也协作,竞合往往能带来最好的结果。 在匹兹堡比赛中,金东感到很沮丧,似乎有一种挫败感。Libratus是如何工作的,机器有没有持续修改,桑德霍尔姆并没有透露,这样做似乎并不公平。不过这种事情我们早就看到过:计算机与人类协作,一起打造面向明天的无敌系统。游戏规则正是这样的。 就在匹兹堡对决即将展开之时,开奖,桑德霍尔姆接受了《华盛顿邮报》的采访,他说:“我很兴奋。”桑德霍尔姆被机器打败了,不过他的牌技并不高明,机器打败他并不是什么了不起的成就。 在过去13天里,Libratus在匹兹堡赌场与4位世界扑克冠军对峙。如果AI可以击败对手,无疑又是一个巨大的突破。到目前为止,比赛已经打了67000手牌,Libratus赢了701242美元的筹码,最开始时是0。换言之,世界冠军们输了701242美元。他们玩的不是真钱游戏,而是争夺20万美元的总资金,最后这笔奖金会由大家分享。 还有53000手牌需要打,如果形势没有逆转,最终AI将会在扑克上战胜人类,这还是第一次。
桑德霍尔姆说:“从一开始Libratus就处在领先位置。”他是一位计算机科学家,简历就有126页,Libratus是桑德霍尔姆12年的研究成果。研究于2004年从卡耐基梅隆大学开始,当时桑德霍尔姆开始研究面向连续信息不完整游戏的抽象算法。 国际象棋属于信息“完整”的游戏,因为对决的双方可以看到棋盘,可以预测对手的下一步。“不完整游戏”不同,双方无法知道游戏的全部信息,比如对方的牌是什么。 桑德霍尔姆认为,无限下注德州扑克模型可以用来推测真实的“不完整”情况,比如网络、军事策略。他想开发一套通用算法,该算法可以进行战略推理。 从Claudico到Libratus 在研究过程中,算法一次又一次输给人类。2015年5月,桑德霍姆在Rivers赌场组织了一次扑克比赛,当时他让AI程序“Claudico”与4名扑克冠军选手对决,Claudico输了732713美元的筹码。 卡耐基梅隆大学在2015年的新闻稿中解释说:“人类在下注时金额一般相当于彩池(所有玩家于该局已下注筹码的总和)的一半或者三分之二,Claudico有时下的注很少,只有10%,有时很多,达到10倍。”参加比赛的人类高手道格?波尔克(Doug Polk)当时向卡耐基梅隆大学解释称:“下注19000美元,只为赢取700美元,人类不会这样干。” 参加“年度计算机扑克竞赛”时,桑德霍尔姆的团队连续2年输给了其它AI团队。桑德霍尔姆解释说:“不同的研究方法带来不同的结果。”但是至今为止没有AI系统打败人类扑克高手,直到Libratus出现。 现在AI又与世界冠军在匹兹堡比赛。桑德霍尔姆称:“AI打牌的方法可能是人类从未使用过的。AI打扑克如同火星人打扑克。”Libratus对无限下注德州扑克的规则有着深刻的理解,它还知道对手可能采取的行动,然后制定策略,被AI打败的冠军选手有2位之前与Clautico对决过。 比赛进程如下:打了27000手牌,Libratus领先50513美元;打了67000手牌,Libratus让金额翻了14倍,增至701242美元。 Libratus面临一个挑战,AI程序是恒定不变的,而人类选手可以不断研究、不断学习、不断提高。人类选手还有获胜的欲望,他们想赢下奖金,还要面临社会的压力。比赛进行到第9天,一位男子对莱斯说:“嗨,你让我们失望。” 现在AI已经成为第一名。桑德霍尔姆已经开始接受结果,他告诉记者,其它AI研究人员发来许多邮件,庆祝Libratus的成功。与此同时,人类玩家用Twitch直播比赛,还用Twitter直播结果。1月23日,莱斯在Twitter发消息称:“人类最终赢了9.3万美元。”现在还不是桑德霍尔姆庆贺的时候,结果月底才会正式出炉。 Libratus曾经与好几名职业扑克高手对决,有单挑,有时会有2名玩家参与,它打了几千场扑克。本次比赛为期20天,刚刚完成一半,Libratus的筹码已经比人类对手多了将近80万美元。虽然并不确定,但是AI获胜的机率很大。 寻找最佳策略 (责任编辑:本港台直播) |