本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】DeepMind团队:发明AlphaGo,不是为了战胜人类

时间:2017-05-25 09:33来源:本港台现场报码 作者:j2开奖直播 点击:
搜狐科技 文/王羚捷 AlphaGo和柯洁的比赛还有两场,机器围棋的能力愈发得到肯定,“人机大战”的噱头也在慢慢退去,我们更关心的是,人工智能何以达到这种水平?未来的人工智

报码:【j2开奖】DeepMind团队:发明AlphaGo,不是为了战胜人类

  搜狐科技 文/王羚捷

  AlphaGo和柯洁的比赛还有两场,机器围棋的能力愈发得到肯定,“人机大战”的噱头也在慢慢退去,我们更关心的是,人工智能何以达到这种水平?未来的人工智能会如何发力?

  5月24日中国乌镇围棋论坛的人工智能峰会上,DeepMind创始人兼CEO Demis Hassabis先生以及DeepMind资深研究员David Silver深入浅出讲解AlphaGo的原理和未来。

报码:【j2开奖】DeepMind团队:发明AlphaGo,不是为了战胜人类

  DeepMind 2010年在于伦敦创立,2014被Google收购,目前已经招募约500名电脑科学家和研究员。

  看完这篇文章,你会了解到:

什么挑战计算机围棋?

什么是深度强化学习?

AlphaGo如何学习?

李世乭不是已经KO了吗?什么还要再来?

战胜了柯洁,阿老师的下一步是啥?

  为什么挑战计算机围棋?

  一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。自从上世纪IBM的深蓝战胜加里·卡斯帕罗夫之后,围棋被看作是“人类智慧最后的遮羞布”。

1997年,深蓝战胜当时世界排名第一的国际象棋选手卡斯帕罗夫

  计算机围棋的难处在于,因为落子的可能性更多穷举搜索的可能性几乎不存在。对于纯粹的计算机运算造成了两项难题:第一是搜索空间过于庞大;其次,也是更为重要的一点,因为变数过多,难以写出评估程序来决定输赢。

国际象棋和围棋的策略穷举对比

  相比于国际象棋,围棋更靠直觉而非计算。如果你在复盘阶段问一个棋手为什么这么下一步棋,他多半会告诉你“凭感觉”,反之国际象棋的职业棋手可能会告诉你他的一系列计算所得的判断。因此,将围棋的策略通过计算量化更为困难。

  此外,围棋中没有等级关系,每一个棋子在结果计算中是平等的。而国际象棋中有不同的角色,对应不同的走法,开奖,每步棋的可选策略就大大减少。

  和国际象棋不同,围棋是一种筑防关系,需要盘算未来关系,而国际象棋是棋子慢慢减少的过程。在棋子小于九个的时候,通过算数计算就可以判断输赢。因而,围棋对于局势的预估要求更高。

  因为场景多变,在围棋中,“一子可撼全局”的局面并不罕见,一举“妙手”往往会对局势产生至关重要的改变。

  所有的这些围棋的高度不确定性让围棋在之前的二十年一直成为计算机科学家希望攀登的高峰。

  什么是深度强化学习?

  科学家将人工智能进一步分为狭义的人工智能和广义的人工智能。上世纪著名的深蓝电脑就是狭义人工智能的代表。深蓝使用预设的国际象棋程序,通过直接输入高手的策略,然后通过搜索来完成计算。在这里,深蓝其实是总结了历史上的国际象棋棋手的所有知识,直接生搬硬套来做应用。这种方式获得的机器知识,不能迁移到其他领域的学习中。

  而Demis一直在思考的问题是:人脑是如何学会完成复杂任务的?电脑能否做到这一点?制造通用学习机器也正是DeepMind目前的工作目标。

  不依赖于人类的原生知识而最终获取知识的人工智能就属于广义的人工智能领域。机器直接从输入和经验中学习,没有既定的程序或者规则可循,系统需要从原始数据自己进行学习。这种算法注重于机器本身的知识习得过程,会产生属于机器的“直觉”和“创造力”,科幻一点说,是机器本身的意识形成过程。因为没有规则的限制,在更多的领域可以有所应用。

  附:一些术语:

  监督学习和无监督学习这两者往往共同出现。监督学习需要人类知识的介入,在给机器输入数据时打上标签,机器通过学习标签和数据的关系,输出新数据的标签预测。而无监督学习的数据输入中不带标签,机器自行学习数据的特性。有无前置的标签输入是区分监督学习和无监督学习的标志。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容