报码:【j2开奖】AlphaGo 其实挺“笨”的_本港台直播_J2开奖直播

报码:【j2开奖】AlphaGo 其实挺“笨”的

　　虎嗅注：就在刚刚，柯洁以四分之一子惜败给了AlphaGo，虎嗅也在现场围观了比赛过程，现场的同事用“惜败”来形容，认为双方势均力敌，“在最后的统计结果上，AlphaGo 以四分之一子获胜，而这其中三又四分之一子是因为柯洁执黑子贴的。”结果已经不重要，相信会有不同的解读声音出来。以上作为一个信息铺垫，下面看这篇角度特别的文章，转载自微信公众号“待字闺中”，虎嗅获授权转载。

　　记得小时候，城里来了个机器人展，于是买了门票，兴致勃勃的去看，有踢球的，有打球的，有玩游戏的，有讲故事的，有谈情说爱的，等等。我最感兴趣的是一个能和我对话的机器人，她会问我问题，也会回答我的问题，好神奇呀。天真无暇的我，玩的很开心，心中有了追求科学的梦想。但是，后来有人告诉我，其实当时每个机器人里面都是藏着一个真人，于是心中咯噔一下，有些沮丧，幼小的心灵就这么受伤了。

报码:【j2开奖】AlphaGo 其实挺“笨”的

　　现在，人工智能取得了飞速发展和进步，儿时的记忆的场景已经完全反转了。看看 AlphaGo 和李世石的围棋比赛，其中最大的看点和吐槽应该是图片中的石头人黄博士，这时，机器人走到了后台，充当了智能的核心，而人，也就是黄博士，只是起到了人机交互的媒介。

报码:【j2开奖】AlphaGo 其实挺“笨”的

　　看来，这次和柯洁的比赛，依然没有改变这种现状，因为现状太难改变了。还是黄博士，而不是黄博士化身的机器人，我是多么期待真正的机器和人下围棋。

报码:【j2开奖】AlphaGo 其实挺“笨”的

　　这么来说，有些异样，为什么这么聪明的 AlphaGo，不真正做成一个机器人，能看棋盘，能下棋子，能思考，还能说笑，会不会更好玩。其实，有时看起来简单的事情，让机器来做不一定简单，这是后话，不啰嗦了。

　　好了，段子讲完了，该言归正传了。免得被唾沫淹死，首先申明一下，AlphaGo 确实很厉害的，也不简单。但是，为什么又说，AlphaGo 挺“笨”的呢？

　　我们知道，围棋的搜索空间很大，有3的19x19次方个状态，要在这么大的空间去找最优算法，一个一个看是不可能的，所以被认为人类智能的一个高点，解决时需要优化搜索。人是根据一些输入空间和参数较少的模式识别来记忆和搜索，而机器采用的却是大数据，大记忆和大计算来实现的。说到 AlphaGo 后面的智能和算法，就不能不说深度学习（DL），强化学习（RL），和蒙特卡洛树搜索（MCTS）。

　　深度学习，主要用来学习和建立两个模型网络。一个是评测现在的棋盘状态如何，也就是说给当前的棋盘状态打个分，评估一下赢的期望值，它就是价值网络（Value Network）。输入是棋盘19x19每个点的状态，有子或无子，输出是赢的期望值。按理说，如果要是有一个聪明的数学家或是机器足够聪明，说不准他马上就能在黑板上写一个高级的数学公式。很遗憾，现在还没有，所以，只能用多层的神经元网络来近似表示这个高级的函数。这么来说，是不是有点“笨”。

　　二是根据现在的棋盘状态，决定下一个棋子该如何走才能有最大的赢的概率，它就是 AlphaGo 的策略网络（Policy Network）。也就是说，给一个19x19的棋盘状态，在所有空的地方，哪个是最佳的选择，会有最大的赢率。同样，也可以用一个函数来描述，输入是当前棋盘状态，输出是每个空处和它期望的赢的期望值，但这个函数还没有一个高级的数学公式，所以，最后也求助于多层神经网络。

报码:【j2开奖】AlphaGo 其实挺“笨”的

　　但是，这两个深度学习网络模型，怎么训练出来的呢？这时，不得不说随机梯度下降（SGD），这个“笨”办法。

报码:【j2开奖】AlphaGo 其实挺“笨”的

　　为了求一个目标函数的最优值，复杂一点的，不能像解一个二次方程一样，用一个简单的公式就能得到方程的解。

报码:【j2开奖】AlphaGo 其实挺“笨”的

(责任编辑：本港台直播)