因此,德扑背后是一个大型的 AI 谈判算法。“冷扑大师” 并不基于大数据、深度学习、强搜索等传统 AI 方法;而是基于博弈论,直接在比赛同时动态优化胜率最高的数学模型。这其中不仅包含了概率统计和运筹策略,也包含了巨大的信息处理计算量。CMU 计算机学院院长 Andrew Moore 在接受采访时说道:“冷扑大师的程序如果要让人类去计算,大概得花人类 1000 万个小时。” 与此同时,冷扑大师也面临着挑战。德州扑克更接近人性,开奖,因为信息是有隐藏的,牌手可以诚实地表达,也可以欺骗地表达,即德州扑克中的诈唬(bluff)技术。而机器明显无法通过对手的动作表情判断对手牌的强弱,也无法通过肢体、神态表演来蒙蔽对手。
在对赛中,冷扑大师无法使用德州扑克中的诈唬技术 百度首席科学家吴恩达(Andrew Ng)就曾指出,“扑克(不完美信息博弈)是人工智能最难攻克的游戏之一。每一步没有所谓的最优解,人工智能要采取随机的策略,这样它诈唬的时候对方才会吃不准。” 相比围棋 AI,德州扑克 AI 应用空间更广泛。现实世界中,不完美信息博弈才是常态,例如在商业谈判、医疗方案制定等领域,这些过去被认为人类拥有独特优势的领域,未来都会面临机器的挑战。 结语: 从 1996 年到 2017 年,人工智能与人类的四次竞赛从侧面反映出了 AI 的进化:从计算能力超越人类到学会自然语言理解,再到深度学习直至掌握不完美信息博弈的能力。在这 21 年中,机器不仅智商越来越高,在情商上也越来越不输于人类。尤其是当 AI 在其最难攻克的游戏德州扑克上与人类叫板,这意味着什么,又将带来哪些机会和挑战? 4 月 10 日上午 10 点到 12 点,极客公园将携手创新工场,和德州扑克 AI “冷扑大师” 背后的主创团队卡内基梅隆大学计算机系教授 Tuomas Sandholm ,创新工场董事长李开复博士及五位国内科技公司创始人一起探讨 “冷扑大师” 背后的技术逻辑以及 AI 会在未来产生哪些更深层次的影响。 这是极客公园前沿社组织的第一次闭门交流。极客公园前沿社是一个企业家社群,通过前沿的技术交流和最有效率的学习机制,帮助企业家自我提升,发现商业创新的新可能!欢迎关注极客公园前沿社公众号和访问官网 f.geekpark.net,在这里收获独家深度内容,共同思考,一起刷新认知。 (责任编辑:本港台直播) |