4月5日,在新智元举办的通用智能研讨会上,atv,阿里巴巴研究人员与来自伦敦大学、清华大学、中科院、北师大的众多专家就《基于双向BiCNet网络的多智能体协作在星际争霸中的应用》这项研究成果,结合类脑计算、认知心理学、强化学习等热点技术进行了深入研讨。据悉,阿里巴巴认知计算实验室和伦敦大学学院发布的这篇文章此前曾受到国际学术界和行业研究者的广泛关注,包括牛津大学、清华大学、韩国科学技术院等多家国内外顶级院校和科研机构来函交流。行业专家表示,阿里在研究星际争霸游戏过程中取得的成果将推动行业将机器学习研究的目标从单体能力提升扩展至团体能力的提升,进而增强机器之间的协作能力,引发AI(Artificial Intelligence)向MI(Machine Intelligence)转变,为实现通用智能探索新的方法。
图为通用智能研讨会现场 阿里认知计算实验室负责人袁泉介绍,学界和工业界在对单个AI智能体研究方面已取得了不俗进展,包括下围棋的AlphaGo、打德州扑克的Libratus以及用于医疗诊断的Watson。但是,智能的提升一方面来自个体,另一方面群体交流、协作也是提升智能水平的重要手段;尤其针对人类不擅长的复杂问题,多AI智能体协作、共同决策可能是个有效途径,在电商、游戏、医疗健康等领域都有广泛应用前景。 图为阿里认知计算实验室负责人袁泉讲解技术原理 阿里与伦敦大学学院合作的星际AI项目正是为研究这一课题而设置,袁泉表示,“星际争霸这一游戏蕴含了人工智能的六大基础问题,涉及感知识别、推理、规划、不确定因素下的决策等各个层面,欢迎学术界和工业界一起来进行研究。今年初阿里在GitHub上开源的Gym-StarCraft工具包也为共同研究提供了一个便利的环境。” 据介绍,该项目基于深度双向协作网络BiCNet,首次提出了多个智能体在意图层面学习进行学习和沟通的观点,并对强化学习中Actor-Critic算法框架进行了创新拓展,引入了分组技术。在没有使用人类示范和标注数据的情况下,BiCNet也能像人类一样通过学习具备智能协同作战的能力。例如,多个枪兵在面对强敌之时学会边退边打,枪兵之间彼此互相掩护,实现敌进我退、敌退我打的阵型变化、陆空兵种协同等高级任务,是第一次在星际中展示可观测到的协作智能。 伦敦大学汪军教授谈到“我们的工作刚刚开始,人工多智能体的研究就像打开一个潘多拉盒子,将会对机器学习甚至是其他学科比如宏观经济学,社会学,生物的进化论的研究发生不可逆转的影响。同时对系统层面的人工智能应用场景,例如金融、电商、媒体、教育等等产生不同的影响”。 中国科学院计算技术研究所研究员、博士生导师史忠植对星际中的协作智能予以高度肯定,“阿里巴巴和汪军老师这边结合,以星际争霸为背景, 演示智能体集体智能,协作完成复杂任务。2017年把人工智能又推向更高的智能高度,有很重要的影响。”中国脑计划统稿人、认知与心理学研究专家范明提到,atv,协作智能是一种高级的人工智能体现,阿里的工作很具有前瞻性,并邀请阿里巴巴加入中国脑计划。 中国科学院自动化研究所研究员、博士生导师余山表示,“一个领域的发展,如果仅仅是学术兴趣推动,可能比较慢。从IT的发展历史看得出来,如果一个领域自身的发展能够结合到整个社会大规模的商业性需求,发展速度会有数量级的提升。这是阿里能够做的事情,能够为类脑的算法、体系结构的设计找到真正的商业应用点,这个非常重要。” (责任编辑:本港台直播) |