码报:【j2开奖】柯洁哭了(3)_本港台直播_J2开奖直播

其次，自然是因为棋类非常适合作为AI算法的标杆。机器和人对弈，是一个博弈的过程，它具有抽象的特性，而棋牌游戏的规则非常明确，状态显示则比较明确。

而在棋牌类中，围棋是非常难以攻克的一类。我们都知道，搜索算法的复杂程度取决于分支系数——每一步棋可能的走法。相比起来，国际象棋的平均分支因子大约是35，而围棋的平均分支因子为250，一局步数为350步，搜索树有250^350个节点，需要更加复杂和先进的搜索算法。在1997年之前，就没有出现过有竞争力的围棋程序。

而战胜众多棋手的AlphaGo，使用的是蒙特卡洛树搜索算法，借助值网络（value network）与策略网络（policy network）这两种深度神经网络，通过值网络来评估大量选点，并通过策略网络选择落点。

神经网络系统是以人类大脑为原型的信息处理模式，可以根据特定的输入产生特定输出，并实现图片识别、语音识别等功能。谷歌做了两个神经网络，一个神经网络用于动态评估——计算对手下一步棋落子的各自可能性，依靠计算机远远超过棋手的计算能力，在某种程度上会占据一定优势。另一个神经网络用于静态评估——评估棋局交战双方总体态势。

谷歌输入了海量棋谱，让AlphaGo以此为基础进行了难以计数的自我对局，以丰富其数据库，预测对手的落子。

AlphaGo胜利后，今年1月，在美国宾夕法尼亚，卡内基梅隆大学开发的德州扑克人工智能系统Libratus击败了四名顶尖人类高手，一举获得了20万美元将近和177万美元筹码。

德扑和AlphaGo所擅长的围棋不同。围棋、国际象棋和西洋双陆等被AI逐个攻破的游戏，都是“完美信息”游戏。也即是，所有玩家在游戏中，能够获得公开和对称的确定信息。游戏中需要作出的决策点的数量，决定了机器的计算量。

而与之相比，德扑则是“不完整信息”游戏。其中包含了更多的隐藏信息，每个玩家掌握的信息都是不对称的，他只能看到自己的牌，却不知道对手的牌，需要根据直觉推测对手手牌，选择下注和放弃，并判断对手的打法。因此，“不完整信息”博弈，就成为难以攻克的计算机难题。

而Libratus，基于在匹兹堡超级计算中心大约1500万核心小时的计算，用算法分析德扑规则，预测所有步骤的胜率，来进行自己的下一步。和AlphaGo用大量棋局做训练不同，它没有用专业牌局进行神经网络训练，而是用随机生成的牌局（随机产生公共牌、底池筹码、玩家拿牌概率）和尝试性的动作带来的结果（在随机生成的输入情况下模拟玩家跟牌后的结果）来作为训练数据。Libratus还采用了博弈论，它通过纳什均衡来计算如何应对对手的招数，通过平衡风险和收益，对自身的下一步进行修正，以期达到收益最大化。其程序名Libratus，就是来源于拉丁文“制衡”。

是的，所以，你知道，风靡我国的“国民运动”麻将，就是不完美信息博弈的一种。目前虽然已经有比较强的AI，但是和人类顶尖高手相比，还是有较大的差距。

柯洁之后，或许我们可以期待一场高水平的麻将人机大赛。但据微软亚洲研究院研究员杨懋和秦涛的文章，最难被AI攻克的，还是星际争霸和我的世界这类游戏。它们不仅信息不对称，而且游戏规则是开放性的。除了运行速度上占优势外，计算机还还需要处理不断出现的复杂的新情况。现在，计算机还没有在这些游戏中证明过自己的能力。

AlphaGo下完棋能做什么？

“AlphaGo 赢了李世石，so what？下围棋本来的乐趣就是对方下一把臭棋，结果机器不会下臭棋，那还有什么意思呢？”

——by：马云

(责任编辑：本港台直播)