本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】柯洁最终战失败!回顾AlphaGo全部对战过程,真正可怕的还在后面……(2)

时间:2017-05-28 04:14来源:本港台现场报码 作者:www.wzatv.cc 点击:
这一局棋的震动也是无可比拟的。在赛后发布会上,双方都承认,当天的棋局,在前面,AlphaGo根本没有显示出胜率优势。DeepMind方也表示:“柯洁在比赛中

  这一局棋的震动也是无可比拟的。在赛后发布会上,双方都承认,当天的棋局,在前面,AlphaGo根本没有显示出胜率优势。DeepMind方也表示:“柯洁在比赛中拥有了很多机会,AlphaGo一度无法处理……我们作为开发者,从来没有见过AlphaGo出现这么势均力敌的情况。”

  这可以说是,迄今为止,人类棋手在和AlphaGo的对弈中,最精彩的一局。

  3、面对劣势时AlphaGo怎么办?认输、逼队友认输……

  之后的最有趣和最令人懵逼的一幕,则出现在昨日的配对赛中。这场赛制规定,两名中国棋手古力、连笑将分别和AlphaGo组队,双方对垒。

  之前,很多人猜测过,AlphaGo会不会有故意输掉比赛、或者下臭棋的可能。那么,当AlphaGo正面对劣势时,它是怎么处理的?这场比赛或许会告诉你答案。

  在对决即将结束之时,与古力搭档的AlphaGo决定投子认输,古力却拒绝了AlphaGo的要求,仍坚持鏖战。而之后,AlphaGo的棋路变得越来越消极,最终,古力在不可逆转的情势下,也只得认输。

  不管你如何认为,但明显,AlphaGo已经成为了控制棋局的关键。

  

码报:【j2开奖】柯洁最终战失败!回顾AlphaGo全部对战过程,真正可怕的还在后面……

  现在的AlphaGo有多强大?

  或许,关于AlphaGo的很多问题,可以在DeepMind对其算法的讲解中得到解释。

  早在去年,AlphaGo就已经以4:1战胜过李世乭。而在今年年初,Master横空出世,在弈城和野狐两大围棋网站上,和各国顶尖棋手快棋对弈,最后以60:0的战绩横扫棋坛。而赛后,Master自揭身,正是AlphaGo的最新版本。

  而这次在乌镇和柯洁对弈的,正是Master。年初的对弈中,柯洁已经在快棋上,败给了它。

  AlphaGo Master和战胜李世乭的AlphaGo Lee相比,有哪些区别?第一局赛后,DeepMind首席科学家席尔瓦在演讲中透露,去年与李世乭对战的AlphaGo Lee有50个TPUs在运作,搜索50个棋步为10000个位置/秒,而昨天打败柯洁的AlphaGo Master则是在单个TPU上进行游戏,计算量只是去年那个版本的十分之一。

  

码报:【j2开奖】柯洁最终战失败!回顾AlphaGo全部对战过程,真正可怕的还在后面……

  

码报:【j2开奖】柯洁最终战失败!回顾AlphaGo全部对战过程,真正可怕的还在后面……

  和柯洁对战的是年初战胜60位高手的AlphaGo Master。

  目前的AlphaGo是单机版。

  配备了4块TPU。

  与去年3月与李世石的比赛时相比,当前的版本在处理计算时所消耗的能量仅为过去的十分之一。

  目前,与柯洁对战的AlphaGo Master的等级分已经接近了4800分。

  现在的AlphaGo采用强化学习,让人工智能进行自我博弈,产生更强的神经网络。这一次AlphaGo用自我对弈训练出的策略网络,可以做到不需要更多运算,直接给出下一步的决策。

  相比之下,现在的AlphaGo比去年击败了李世石那一版的AlphaGo Lee相比要“强三子”。

  4块TPU,单机版,完虐了人类。而“强三子”的概念是什么?让柯洁的反应来告诉你。

  

码报:【j2开奖】柯洁最终战失败!回顾AlphaGo全部对战过程,<a href=j2直播,真正可怕的还在后面……" src="http://www.wzatv.cc/atv/uploads/allimg/170528/041A13413_0.jpg" />

  如果说打败了李世乭的AlphaGo是利用卷及神经网络,让它了解规则、了解棋局,从而进行处理,那么,现在的AlphaGo,就增强了“思考”能力,并且,可以自学成才了。

  在这次赛前,很多媒体报道,此次参战的 AlphaGo 2.0 可能采用了全新的算法模型,放弃了监督学习,即未先学习人类棋谱的经验,而是直接通过对战来获得认知和能力。但哈比萨斯在赛后发布会上回答,这明显是个误解。AlphaGo还是要学习人类经验,但这个版本的AlphaGo更依赖自我博弈来学习。

  如何让AlphaGo进行监督学习和强化学习,席尔瓦解释,是让AlphaGo先通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。也就是说,在这个过程中, AlphaGo不仅会算出自己的最优选项,还会根据自己下过的棋,经过多层处理形成一个“值”,值高意味着自己赢,低意味着对手赢,并在棋局中的某一步判断是否是关键的一步。

  并且,AlphaGo的搜索算法能在计算能力之上,加入和人类直觉近似的判断,让它更接近人脑。

  

码报:【j2开奖】柯洁最终战失败!回顾AlphaGo全部对战过程,真正可怕的还在后面……

  为什么选择棋牌?

  那么,为什么科学家都执着于让机器和棋牌类游戏过不去呢?让一个电脑学会下棋,对我们究竟有什么好处?

  原因很简单。首先,棋牌类是人类智力活动的象征,它的宣传和号召能力自然也是其他运动所不能比拟的。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容