本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】柯洁哭了(3)

时间:2017-05-28 13:53来源:报码现场 作者:开奖直播现场 点击:
其次,自然是因为棋类非常适合作为AI算法的标杆。 机器和人对弈,是一个博弈的过程,它具有抽象的特性,而棋牌游戏的规则非常明确,状态显示则比较

其次,自然是因为棋类非常适合作为AI算法的标杆。机器和人对弈,是一个博弈的过程,它具有抽象的特性,而棋牌游戏的规则非常明确,状态显示则比较明确。

而在棋牌类中,围棋是非常难以攻克的一类。我们都知道,搜索算法的复杂程度取决于分支系数——每一步棋可能的走法。相比起来,国际象棋的平均分支因子大约是35,而围棋的平均分支因子为250,一局步数为350步,搜索树有250^350个节点,需要更加复杂和先进的搜索算法。在1997年之前,就没有出现过有竞争力的围棋程序。

战胜众多棋手的AlphaGo,使用的是蒙特卡洛树搜索算法,借助值网络(value network)与策略网络(policy network)这两种深度神经网络,通过值网络来评估大量选点,并通过策略网络选择落点。

神经网络系统是以人类大脑为原型的信息处理模式,可以根据特定的输入产生特定输出,并实现图片识别、语音识别等功能。谷歌做了两个神经网络,一个神经网络用于动态评估——计算对手下一步棋落子的各自可能性,依靠计算机远远超过棋手的计算能力,在某种程度上会占据一定优势。另一个神经网络用于静态评估——评估棋局交战双方总体态势。

谷歌输入了海量棋谱,让AlphaGo以此为基础进行了难以计数的自我对局,以丰富其数据库,预测对手的落子。

AlphaGo胜利后,今年1月,在美国宾夕法尼亚,卡内基梅隆大学开发的德州扑克人工智能系统Libratus击败了四名顶尖人类高手,一举获得了20万美元将近和177万美元筹

德扑和AlphaGo所擅长的围棋不同。围棋、国际象棋和西洋双陆等被AI逐个攻破的游戏,都是“完美信息”游戏。也即是,所有玩家在游戏中,能够获得公开和对称的确定信息。游戏中需要作出的决策点的数量,决定了机器的计算量。

而与之相比,德扑则是“不完整信息”游戏。其中包含了更多的隐藏信息,每个玩家掌握的信息都是不对称的,他只能看到自己的牌,却不知道对手的牌,需要根据直觉推测对手手牌,选择下注和放弃,并判断对手的打法。因此,“不完整信息”博弈,就成为难以攻克的计算机难题。

而Libratus,基于在匹兹堡超级计算中心大约1500万核心小时的计算,用算法分析德扑规则,预测所有步骤的胜率,来进行自己的下一步。和AlphaGo用大量棋局做训练不同,它没有用专业牌局进行神经网络训练,而是用随机生成的牌局(随机产生公共牌、底池筹、玩家拿牌概率)和尝试性的动作带来的结果(在随机生成的输入情况下模拟玩家跟牌后的结果)来作为训练数据。Libratus还采用了博弈论,它通过纳什均衡来计算如何应对对手的招数,通过平衡风险和收益,对自身的下一步进行修正,以期达到收益最大化。其程序名Libratus,就是来源于拉丁文“制衡”。

是的,所以,你知道,风靡我国的“国民运动”麻将,就是不完美信息博弈的一种。目前虽然已经有比较强的AI,但是和人类顶尖高手相比,还是有较大的差距。

柯洁之后,或许我们可以期待一场高水平的麻将人机大赛。据微软亚洲研究院研究员杨懋和秦涛的文章,最难被AI攻克的,还是星际争霸和我的世界这类游戏。它们不仅信息不对称,而且游戏规则是开放性的。除了运行速度上占优势外,计算机还还需要处理不断出现的复杂的新情况。现在,计算机还没有在这些游戏中证明过自己的能力。

  4

AlphaGo下完棋能做什么?

“AlphaGo 赢了李世石,so what?下围棋本来的乐趣就是对方下一把臭棋,结果机器不会下臭棋,那还有什么意思呢?”

——by:马云

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容