下得不好的时候是因为其价值判断本来就是一个近似,atv直播,而且搜索空间也不能穷尽,得不到最优解,因此,有时估计还不错的棋,其实不一定是真的最好的下法,AlphaGo出现这种不稳定状况是正常的。这也是人类善存的希望所在。当然人类也有自身的弱点,如疲劳、情绪波动等,人也会判断失误。 而且棋局很长,有些之前不太好的棋,经过后面的变化(包括不是预料中的变化)有可能会变成好棋。所以,不是所有的错误,都会直接影响到比赛的结果。而且现在大家似乎有点怕AlphaGo了,即便是AlphaGo下出一招不好的棋,大家更多的是怀疑自己的水平(是不是我们没看懂啊?),而选择相信AlphaGo的“深谋远虑“。 误区三:AlphaGo可以不断自学习,从新的棋局里获取经验,快速提升自己。 AlphaGo的系统由于参数非常多,需要大量的数据来训练,新增的几幅棋谱对提高它的棋力起不到任何作用。而且AlphaGo在做参数调整时是针对一大批数据的整体优化,也必须对很多棋谱做批量处理,训练时间非常长,不可能在很短时间内内大幅提升自身的水平。即便是同一组训练棋谱,参数调整方法不一样也会训练出棋力水平差异较大的系统。其实AlphaGo是通过自我对弈来生成很多棋谱,然后利用棋谱中的(两个连续的)盘面跟最后的胜负对应关系训练出价值网络来。 这里只是借用了一下强化学习的框架来训练深度神经网络的参数而已,主要贡献还是深度学习的近似能力带来的(解决了传统强化学习针对复杂环境和动作状态无法求解的难题)。因此,AlphaGo并没有大家想象的那种自我博弈就能自己不断进步的能力。 误区四:AlphaGo会故意放水输掉一局比赛。 这个没有可能。要想输还不能输的那么难看和明显,是一件非常难办的事情,可能比赢棋还要难。在模型训练好之后,AlphaGo能够临时改动的只有在搜索部分投入的资源多少(搜索多大的空间)可以改动。缩减的太小,几乎不会有太大变化,但如果缩减太多,就会下出一些非常低级的棋来。这点从技术角度来讲很难把握。 总结: 基于人类目前对围棋的认识和理解,现阶段仍然会输给人工智能。我并不觉得柯洁有希望能够赢得后面的比赛。但人类也在进步,通过跟AlphaGo的对弈,人类也在重新认识围棋。只要人类的思想和文明在不断进步,人就有可能在未来5-10年里通过不断的学习赶上当前的AlphaGo。 当然,AlphaGo也会进步,但它还不是围棋之神,也没有攻克围棋这个难题。如果现有的学习方法没有全面的革新,其进步的速度也会慢慢放缓。基于此考虑,人类还会有机会。当人们对围棋有了更深入的了解之后,又会设计出更好的人工智能算法。两者其实并不矛盾,相辅相成,互相促进,不管谁输谁赢都是人类文明进步的体现。人类的智能也将始终走在机器的前面,而不会被机器取代。 来源:搜狐科技 (编辑:钱馨瑶) 企业思想家 微信号: Enterprisethinkers (←长按复制)“企业思想家”是《企业观察报》的官方微信。 《企业观察报》(CN11-0279)是由国务院国资委下属中国企业改革与发展研究会主管主办、大型国有企业投资、实行市场化运营的全彩色财经类周报。本报致力于和中国企业管理者共同“观察经济新常态,洞悉企业新机会”,传播中国企业管理新思想、新方法,发现并推介中国企业思想家。 “企业思想家”内容以原创为主,偶有转载我们会注明出处。 报社地址:北京市海淀区紫竹院南路2号5层(100000) QQ:1693265882 版权声明 如果您认为我们的授权或标注与事实不符,请告知我们,我们会与您共同协商解决,谢谢! (责任编辑:本港台直播) |