对于第一个疑惑,或许应该由AlphaGo背后的这支顶级人工智能开发团队DeepMind来解答。只是很可惜,他们并没有出席这场发布会(但你会在5月比赛现场看到他们)。 与一年前的解释大致相同,DeepMind团队通过录像告诉我们,新版AlphaGo的核心仍然是蒙特卡罗树搜索(MCTS)。 如果直接给你解释“蒙特卡罗树搜索就是根据某一个节点R去随机寻找另一个节点T”,这听起来会有点费力。其实早在去年,《人民日报》就给了这个看起来高大上的算法一个非常通俗易懂的解释: “假如篮子里有1000个苹果,让你每次闭着眼睛找一个最大的,可以不限制挑选次数。于是你闭眼随机拿了一个,然后再随机拿了第二个与第一个比较,留下最大的;然后再随机拿一个,再比较留下最大的……这样循环往复,拿的次数最多,挑出的苹果可能性就越大。但是,除非你把这1000个苹果都挑一遍,否则无法100%肯定自己拿的是否是最大的那只。” 换句话说,这个算法就是由n多个随机结果去逼近所需要的精确结果。 接下来的东西就比较好理解了。 根据介绍,AlphaGo采用深度学习技术训练形成的两个网络之一——“策略网络”能够对所有落子位置进行概率分布,随后把生成的概率信息反馈到蒙特卡罗搜索树中,通过上面的“苹果比较过程”,逐渐生成一个最符合人类棋手思维的可行下法。 换言之,策略网络的功能是“想人类所想”。 而另一个“估值网络”,则负责估算胜率。然后再将这些估算出的信息投入到蒙特卡罗搜索中,继续通过“苹果比较过程”,推算出胜率最高的一些算法。 所以这个网络的功能是“寻找打赢人类的走法”。 想想看,面对一个既能抢先读懂你的棋路,又能根据你的棋路迅速生成一套更优对抗策略的对手,你的赢的概率会有多少? 但是我们刚才也说了,不到1000个苹果,你无法完全确认手里的苹果是否是最大的那个。也就是说,AlphaGo给出的只能是棋局更高的胜率,而没有100%的胜算。 这也就从某种程度上解释了,李世石为何能从AlphaGo那里扳回一局。 不过按照AlphaGo强大的算力与学习能力,一年后的回归,即便仍然在面对复杂棋局时会有“恍惚”的微小概率,其面对人类棋手也已经撒下了天网。 第二个问题:这个老掉牙的疑问请交给科幻小说家 早在一年前,大家还在问这样一个问题:在棋类竞技中,人们还有机会打败人工智能吗?然而如今,大多数人的疑问则变成了“人工智能何时会全面超越人类”。 这是对人类的威胁?恐惧?专家和一些媒体们请放心……这是年轻人们处于对“人工智能竟然可以碾压人类智商”的兴奋状态…… 确切来讲,这是一个伪命题。 难道汽车不早就比人类跑得快了吗?同理还有电脑的运算与搜索能力。 但你指的是如果是所谓像电影《机械姬》与美剧《西部世界》中出现的“机器觉醒”与“自主意识”,那就有必要被提醒这样一个事实: 如今,算法尚且不能识别嘈杂环境中叠加在一起的自然语言(准确率很低),一个个所谓的语音助手、智能音箱,也总是会出现识别错误,并没有让人们感受到真正的智能化。因此,它们又怎样在一个个“交叉领域”完全复制人类的直觉与想象力? 我们明明还处于一个名副其实的弱人工智能时代。 所以,就像《三体》的作者刘慈欣老师所说的那样:什么“人工智能统治人类”或“天网觉醒”,只需要科幻作家考虑就行了。 (责任编辑:本港台直播) |