本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】人机对战简史:从国际象棋到德州扑克(2)

时间:2017-04-08 23:49来源:天下彩论坛 作者:118开奖 点击:
Watson 基于 16TB 内存、2880 个 Power 7 系列处理器——当前架构中最强的处理器。这就意味着 Watson 的快。第一是检索快,它能够在 3 秒内检索数百万条信息,

  Watson 基于 16TB 内存、2880 个 Power 7 系列处理器——当前架构中最强的处理器。这就意味着 Watson 的快。第一是检索快,它能够在 3 秒内检索数百万条信息,并选择三个可能性最高的答案;第二是判断快,它能够迅速结合场上情况做出抢答与否的决策;第三是抢答快,当其中一个答案的可能性超过 50% 后,立即启动抢答。它超越人类的抢答速度主导了整场比赛。

  AlphaGo与围棋人机大战

  关键词:深度学习,神经网络

  围棋曾经是人工智能遥不可及的战场。

  国际象棋中,平均每回合有 35 种可能,一盘棋可以有 80 回合,而围棋每回合有 250 种可能,一盘棋可以长达 150 回合。同时,一场围棋比赛中出现的不同局面多达 3 的 361 次方种。

  

【j2开奖】人机对战简史:从国际象棋到德州扑克

  李世石与 AlphaGo 对决以 1:4 告负

  此外,围棋博弈是多个局部战争合成的最终结果,同时局部之间相互影响,无法被算法穷举。更专业点说,围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆。

  谷歌的 AlphaGo 程序突破了传统电脑的 “固定” 程序逻辑,融入了深度学习和神经网络的能力。这个深度神经网络由策略网络和值网络两部分组成,策略网络负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的。这样 AI 就可以重点分析那些有戏的棋着。值网络负责减少搜索的深度——AI 会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。

  AlphaGo 利用这两个工具学习了人类所有的棋谱,经过了几千万次的自我对弈与学习,不仅能够模仿人类棋手的思考,甚至已能够超越。2016 年 3 月,在与 AlphaGo 对决的人机大战中,来自韩国的世界围棋冠军李世石以 1:4 告负。

  除了计算能力外,这场比赛还暴露出机器的其他优势:赛场上,人会因为比赛环境和压力等外部或情绪因素影响判断,而机器不会;在数小时的鏖战中,人会因疲倦而分神,机器却能永远保持专注。赛场外,人每天可做的练习是有限的,j2直播,AI 则能以上万倍于人类的速度练习。

  李世石在比赛后接受采访时说道:“要适应与 AlphaGo 的比赛,首个挑战就是心理方面,需要非常专注。我继续和它下不一定能赢,因为无法比它更专注,这些方面是赢不了它的。”

  2017 年 3 月,AlphaGo 的升级版 Master 横空出世,通过下快棋连胜职业高手 60 盘,其中就包括了中国最强棋手柯洁。

  AlphaGo2.0 发布于 2017 年年初,相比于 1.0,这个版本能称得上真正的 “自我学习”。1.0 版本的 AlphaGo 以人类所有棋谱为蓝本,AlphaGo 再怎么走也只是算出了人类棋手曾走过的某一步,顶多算是个完美的 “人类棋手”。而 2.0 版本 AlphaGo 就利用这个“完美棋手”的估值函数自我对局和 “深度学习”,超出了人类棋谱的范围,是真正机器算出来的棋法。

  2017 年 4 月,AlphaGo 还将有一场与柯洁的人机对战,这或许将会是人机在围棋领域的最后一战。

  德州扑克人机大战

  关键词:不完美信息的博弈

  2017 年 1 月 11 日至 1 月 30 日,美国卡内基梅隆大学开发的人工智能 Libratus(“冷扑大师”)与 4 名人类顶尖德州扑克选手之间的 “人机大战” 在美国匹兹堡进行,经过了为期 20 天,总计对战 12 万手牌的赛程,最终人工智能取得胜利。

  与之前和人类在棋类的竞赛中比拼智力不同,AI 在德州扑克项目上挑战人类反映了 AI 更值得关注的进化方向。

  围棋、国际象棋比赛中双方所有信息一览无余,本质上是对称信息的博弈,而德州扑克是信息不对称的博弈,每个选手只能看到自己的手牌。这就决定了人工智能首先需要面对大量不完整的信息。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容