翻译:刘小芹 弗格森 新智元启动 2017 最新一轮大招聘:。 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。 简历投递:j[email protected] HR 微信:13552313024 【新智元导读】游戏,更准确地说,atv,模拟场景对于人工智能的研发来说是一个非常理想的场所,对于人工智能技术走向实际应用有着不容忽视的推动作用。目前,DeepMind、微软、Facebook、OpenAI 等都在研究通过游戏场景训练AI。本文结合《经济学人》的文章《AI研究者为什么喜欢游戏》,全面梳理了用游戏训练AI的几大开源平台,对这一方向的领导者DeepMind的路径进行分析。文章提到了“具身认知”的理论,认为智能应该完全从经验进行学习。可以肯定的是,机器“眼中”的游戏和人类所理解的游戏是不一样的,在这种虚拟与现实之间,“智能”会真正发生。 游戏,更准确地说,模拟场景对于人工智能的研发来是一个非常理想的场所。对于人工智能技术走向实际应用有着不容忽视的推动作用。目前,DeepMind、微软、Facebook和阿里巴巴都在研究用 AI 来玩游戏,希望能增强 AI 智能体的通用能力,让AI 更像人。 《经济学人》最近发表了一篇题为《AI研究者为什么喜欢游戏》的报道,通过讲述一个计算机科学家在游戏场景中训练AI,计算机系统可以更好地识别交通信号的故事,分析了视频游戏对于训练人工智能的关键作用。 从识别交通信号说起 《经济学人》的文章讲述了一个神经科学家用游戏场景来教计算机理解交通信号的故事: 去年,普林斯顿大学的一名计算机科学家Arthur Filippwicz遇到了一个“交通标志难题”。Filipowicz 正在教汽车如何“看见”和“理解”世界,让汽车拥有一个在不需要人类协助的情况下能自己驾驶的视野。其中需要的一种能力便是识别交通信号。为了达到这一目的,他曾多次尝试,希望能训练一个合适的算法。这样的训练指的是,向这一算法(更准确地说,是向运行这一算法的计算机)展示在不同的情况下大量交通信号的图片:包括新的和旧的、干净的和脏的、部分被建筑物遮挡的、强光照射下的、雨中的、雾中的、白天的、黄昏的和夜里的等等。 要想从图像数据库中拿到所有这些种类的图片并不容易。而要派人去拍下这些所有类型的图像,又太耗费人力了。所以,Filipowicz 博士选择了游戏“Grand Theft Auto V " (侠盗猎车手 V),这是一个最近很火的视频游戏。“侠盗猎车手 V” 因为包含了大量的犯罪和暴力而饱受争议,但是,在Filipowicz 看来,这款游戏很完美,因为它同样描绘了现实世界中的交通信号。通过修补游戏软件,他从游戏中拿到了数千张关于这些信号的照片,关于几乎各个场景,来让他的算法进行消化。 Filipowicz 博士的交通信号标志很好地说明了人工智能研究者对视频游戏的喜爱。其中有几个原因:一些人,例如 Filipowicz 博士,使用视频游戏作为训练场,用来代替真实世界。也有人观察到,不同的游戏要求具备不同的认知技能,他们认为,游戏可以帮助他们理解如何将智能分解为更小的、更加可以管理的细块。还有一些人,基于以上两个观察,认为游戏能帮助他们建立更加正确的人工智能(或者,甚至是自然智能)理论。 Open AI、DeepMind 和微软的开源AI游戏训练平台 显然,对于机器和人来说,“玩”游戏并不是同一回事。在上文提到的所有这些情况下,这些游戏需要先被调整解构,以便它们能被另一个计算机程序直接播放,而不是一般情况的人用屏幕来播放观看。例如,利用一个叫做“Deep Drive”的软件,“侠盗猎车手V”可以由一个有很多道路标志图像的图片源转变为一个自动驾驶汽车的驾驶模拟器。这样,这些车辆的驾驶和导航程序就可以控制了,这比让它们在真实的道路上测试更便宜,也更安全。 游戏公司也开始明白这一点。例如,2015年5月,微软启动了 Malmo 项目,j2直播,这是基于一个流行游戏“Minecraft”的 AI 开发平台。2016年11月,“星际争霸II”的所有者暴雪公司与 DeepMind 宣布了类似的合作。12月,OpenAI 开源了 Universe 平台,免费供所有人使用,其中包含数百个游戏,可以通过适当的程序直接播放。Universe 提供的游戏从畅销的大型游戏如“传送门2”(一个基于物理的解谜游戏),到低成本的娱乐网游,如“小海马泡泡龙”和“太空斑马”,应有尽有。 1. 微软Malmo (责任编辑:本港台直播) |