本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【组图】卡斯帕罗夫自述:从深蓝到 AlphaGo,从狭义 AI 到通用 AI(3)

时间:2017-04-18 03:27来源:668论坛 作者:www.wzatv.cc 点击:
二、比这个更难的是,几乎没有一个合适的评价函数来定义谁是赢家, atv ,赢了多少;这个评价函数对于该系统是至关重要的。而对于象棋来说,写一个

  二、比这个更难的是,几乎没有一个合适的评价函数来定义谁是赢家,atv,赢了多少;这个评价函数对于该系统是至关重要的。而对于象棋来说,写一个评价函数是非常简单的,因为象棋不仅是个相对简单的游戏,而且是实体的,只用数一下双方的棋子,就能轻而易举得出结论了。你也可以通过其他指标来评价象棋,比如棋子移动性等。

  所有的这些在围棋里都是不可能的,并不是所有的部分都一样,甚至一个小小部分的变动,会完全变化格局,所以每一个小的棋子都对棋局有着至关重要的影响。最难的部分是,我称象棋为毁灭性的游戏,游戏开始的时候,所有的棋子都在棋盘上了,随着游戏的进行,棋子被对方吃掉,棋子数目不断减少,游戏也变得越来越简单。相反,围棋是个建设性的游戏,开始的时候,棋盘是空的,慢慢的下棋双方把棋盘填满。

  因此,如果你准备在中场判断一下当前形势,在象棋里,你只需看现在的棋盘,就能告诉你大致情况;在围棋里,你必须评估未来可能会发生什么,才能评估当前局势,所以相比较而言,围棋难得多。也有很多人试着将 DeepBlue 的技术应用在围棋上,但是结果并不理想,这些技术连一个专业的围棋手都打不赢,更别说世界冠军了。

  所以大家就要问了,连电脑操作起来都这么难,人类是怎样解决这个问题的?其实,人类是靠直觉的,而围棋一开始就是一个靠直觉而非计算的游戏。所以,如果你问一个象棋选手,为什么这步这样走,他会告诉你,这样走完之后,下一步和下下一步会怎样走,就可以达到什么样的目的。这样的计划,有时候也许不尽如人意,但是起选手是有原因的。

  然而围棋就不同了,如果你去问世界级的大师,为什么走这一步,他们经常回答你直觉告诉他这么走,这是真的,他们是没法描述其中的原因的。我们通过用加强学习的方式来提高人工神经网络算法,希望能够解决这一问题。我们试图通过深度神经网络模仿人类的这种直觉行为,在这里,需要训练两个神经网络,一种是决策网络,我们从网上下载了成百万的业余围棋游戏,通过监督学习,我们让阿尔法狗模拟人类下围棋的行为;我们从棋盘上任意选择一个落子点,训练系统去预测下一步人类将作出的决定;系统的输入是在那个特殊位置最有可能发生的前五或者前十的位置移动;这样,你只需看那5-10种可能性,而不用分析所有的200种可能性了。

  一旦我们有了这个,我们对系统进行几百万次的训练,通过误差加强学习,对于赢了的情况,让系统意识到,下次出现类似的情形时,更有可能做相似的决定。相反,如果系统输了,那么下次再出现类似的情况,就不会选择这种走法。我们建立了自己的游戏数据库,通过百万次的游戏,对系统进行训练,得到第二种神经网络。选择不同的落子点,经过置信区间进行学习,选出能够赢的情况,这个几率介于0-1之间,0是根本不可能赢,1是百分之百赢。

  通过把这两个神经网络结合起来(决策网络和价值网络),我们可以大致预估出当前的情况。这两个神经网络树,通过蒙特卡洛算法,把这种本来不能解决的问题,变得可以解决。

  AlphaGo 给围棋带来了新方法,它背后主要的方法是Value Networks(价值网络)和 Policy Networks(策略网络),其中Value Networks 评估棋盘位置,Policy Networks 选择下棋步法。这些神经网络模型通过一种新的方法训练,结合人类专家比赛中学到的监督学习,以及在自己和自己下棋(Self-Play)中学到强化学习。这不需要任何前瞻式的 Lookahead Search,神经网络玩围棋游戏的能力,就达到了最先进的蒙特卡洛树搜索算法的级别(这种算法模拟了上千种随机自己和自己下棋的结果)。同时AlphaGo也引入了一种新搜索算法,这种算法将蒙特卡洛模拟和价值、策略网络结合起来。

  哀叹给地板打蜡的工作被新技术取代,比抱怨抗生素让墓葬工失业好不了多少

  在输掉了和深蓝决赛的 20 年后,当年那个曾和32 台象棋 AI 计算机 进行车轮大战(1985年)并取得了32-0 全胜的意气风发的象棋天才,深沉地写下了如下文字:

  我讨厌失败,这不是什么秘密,我也不太会面对失败。然而当时很多人认为这次失败对整个人类都是一次打击,对我来说却没有那么严重。新闻周刊的封面报道把这场比赛称为“人类大脑的最后一道防线”。1997年的那6场比赛为数字时代的“人机大战”蒙上了一层阴影,就像当年 John Henry 和自动气钻机的比赛一样( 根据故事传说,为了工作权利和奴隶尊严,19世纪70年代,美国有一位名叫约 翰.亨利的黑人钢钻工,奋力与自动气钻机竞赛,最后赢得了胜利,可是也把自己给累死了——编者注)。

【j2开奖】卡斯帕罗夫自述:从深蓝到 AlphaGo,从狭义 AI 到通用 AI

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容