5月23日下午,围棋界“人机大战”第二季第一局结果尘埃落定。AlphaGo 赢四分之一子,中国棋王柯洁和人工智能的首战仍以AlphaGo胜利告终。虽然看上去柯洁输的并不多,但聂卫平以及常昊夫妇都表示这其实是AlphaGo的设定问题,AlphaGo只追求安全稳健简单。换句通俗话说就是,你输多少是AlphaGo算好了的,知道它的威力有多强大了吧。 而早早在媒体上预测AlphaGo必胜的两位谷歌前员工,流利说联合创始人兼首席科学家林晖博士和首席算法工程师孙怿博士在现场近距离观战后表示,结果“并不令人意外”,大家的关注点不再是机器是否会赢,而是机器将用什么姿势战胜人类。 (现场对战图片) 虽然赛前有专家认为,对AlphaGo有所了解和准备的柯洁,与李世石相比胜算略高,但林晖表示:“机器在复杂局面的运算能力上,j2直播,在处理能力上比人类棋手有着无可比拟的优势。尤其在对弈的中后段,机器的情绪状态稳定性,更是有人类难以企及的高度。” (两位专家合影,右一:流利说首席科学家林晖,左一:流利说首席算法工程师孙怿) “AlphaGo2.0比之前AlphaGo1.0更能体现人工智能在棋类竞赛中的优势:人类无法企及的训练量。”林晖表示:“现阶段,atv,AI之所以‘智能’主要还是基于海量数据基础。 AlphaGo已输入了几乎全部可搜集到的棋谱和对弈记录作为训练数据, 可以说已‘阅遍天下无敌手’”。林晖认为:运算速度极快等AI的“基本素质”是大家都公认的,而训练量的优势,只有在AI升级之后才能比较清晰的展现出来。 同时,林晖也从技术角度解释了柯洁“与AlphaGo试招时下法‘很仙’”的说法,他表示“从技术上看,AlphaGo胜在“没套路”,AlphaGo严格意义上来说并不是人类教出来的最好学习生,所以不会被人类的下法所束缚。AlphaGo2.0在AlphaGo1.0的教导下,已经超越棋谱,自我督学。AI与AI之间可以相互较量,达到不眠不休、无时无刻地“左右互搏”。因而在布局和下法上自成一体,超越人类。” 本质上,AlphaGo2.0跳出了两千年来人类围棋的经验,另辟蹊径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。类比看人类文明与智慧的进化,或许人工智能也打开了人类新进化史的篇章,重新认知智慧的边界,去挖掘人类未知文明的新高度。 毕业于国际顶尖人工智能实验室瑞士IDSIA,与AlphaGo研发团队DeepMind创始人之一Shane Legg系出同门,师从“人工智能之父” Jürgen Schmidhuber的孙怿对师兄的AI项目一直非常关注,看完今天的比赛后,他认为从技术上而言,乌镇的AlphaGo2.0比Master时期又更进一步。 (现场观战的孙怿博士) 孙怿认为增强学习(reinforcement learning)技术的精进是AlphaGo2.0的最大亮点。作为其博士期间的研究方向之一,孙怿对这一技术给出了完整分析:“解决AI与未知环境的交互,有效的达成复杂目标:在这里未知环境指的是给定棋盘格局下的形势好坏判断。增强学习可以从大量对弈结果的输赢学习出中盘的形势的好坏(value function)以及每种落子的好坏 (q function)。AlphaGo通过1.0版本历史交互对环境有效建模,在交互试错中理解每个环境状态的好坏,在不确定性的情况下进行规划,因而预判能力与布局能力进一步提升。” 目前,增强学习在已经展现出强劲的实际应用潜力,流利说自主研发并即将全新升级的AI英语老师就基于了增强学习算法。在两位专家的带领研发下,流利说AI将在增强学习算法训练下,不断自我进化。体现在自适应体验方面,用户的学习路径会呈现“千人千面”的面貌,对于学生的针对性会进一步增强,进而提供更高的学习效率。 (流利说AI英语老师能力模型) (责任编辑:本港台直播) |