钛媒体注:AlphaGo再一次卷土重来,这一次的对手将是柯洁等为代表的中国顶尖棋手! 今天(4月10日),谷歌在中国棋院召开发布会,宣布5月23日-27日在乌镇主办“中国乌镇·围棋峰会”,届时AlphaGo将再度与柯洁等为代表的中国顶尖棋手进行围棋对弈。 除了备受瞩目的AlphaGo与世界排名第一的柯洁的三番棋对弈之外,本次峰会还将举办配对赛和团队赛,配对赛中,两位棋手将分别与AlphaGo组队,挑战棋手如何理解AlphaGo独特风格并与之合作;在团体赛中,将由五位中国顶尖棋手合作,建立棋手“神经网络”,降低心里因素的影响,从而做出更加客观的判断。 距离去年AlphaGo 战胜李世石,已经过去了1年多的时间。在五局三胜制的比赛中,AlphaGo连胜三局提前2轮赢得了比赛,虽然李世石最终赢得了一局比赛,atv,挽回了颜面,但是AlphaGo展现出了无懈可击的强大,让人印象深刻。 然而,当时对弈的只是AlphaGo的1.0版本,本次与职业围棋九段选手柯洁对战的是AlphaGo的2.0版本,它采用了新的算法模型。 而在去年12月29日开始,它还曾经化名Master在围棋网站上轮番挑战中日韩围棋棋手,其中包括了聂卫平、朴廷桓、井山裕太等知名高手,并在1月3日晚间赢了柯洁,最终以60场不败的战绩结束了非正式的测试。 AlphaGo是谷歌DeepMind团队开发的一款围棋人工智能程序。据DeepMind介绍,1.0版本的AlphaGo是“深度学习”人类棋谱得出围棋手数的估值,AlphaGo1.0所走招法其实并没有脱离人类的理解,而且也是人类棋手曾下过的棋。如果AlphaGo1.0完善到极致,j2直播,就意味着得出了接近完美的围棋手数估值函数。 2.0版本AlphaGo利用这个估值函数自我对局和“深度学习”,不再受人类棋谱的局限,下出真正属于“人工智能”的围棋。 AlphaGo主本身主要由以下部分组成: 走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋; 快速走子(Fast rollout),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋网络快1000倍; 估值网络(Value Network),给定当前局面,估计是白胜还是黑胜; 蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这三个部分连起来,形成一个完整的系统。 根据AlphaGo研究者DavidSilver的解释,AlphaGo的策略是围棋巨大无比的搜索空间压缩到可控的范围之内。 在AlphaGo两种不同的神经网络中,“策略网络”的作用是预测下一步,并用来将搜索范围缩小至最有可能硬起的那些步骤;“价值网络”则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。 在之前,腾讯AI Lab团队也推出了自己的围棋人工智能“绝艺”,不但赢得了世界围棋AI冠军,也在后续的比赛中战胜了人类棋手。而根据绝艺团队的介绍,绝艺的算法也是基于AlphaGo的策略网络和价值网络两大核心。 而且,会下围棋的AlphaGo也只是DeepMind研究的人工智能项目之一。作为谷歌的顶尖技术团队,其更大的目标是在智能助手、医疗和机器人这样的领域取得进展,另外,尽管AlphaGo只是针对围棋开发的系统,但其原理可以被应用到现实问题中。 (钛媒体编辑张霖综合报道) (责任编辑:本港台直播) |