在Langford研究的最新的强化学习方案中,该系统还能因选出部分正确的行为而得到加分,这使筛选出正确答案的过程变得更轻松。微软研究人员表示,决策服务是一个激动人心的突破,因为它能够利用上下文信息而帮助系统做出决策。 微软纽约研究院的研究员Siddhartha Sen表示:“当你做决定时,你通常已经大概知道这有多明智。现在我们有机会利用机器学习来优化这些决策。” 研究人员表示:预览版中提供的基于云的系统之所以是开创性的,部分原因是它能够应用于许多不同的情况。 例如,它可以用于想要个性化内容推荐的新闻通讯社,以及想要个性化健身活动的移动健康应用程序,或者希望优化服务器资源的云提供商。 Sen表示,测试服务的一个关键目标就是让那些可能无法自己创建这类机器学习技能的人们能够轻松方便地使用机器学习技术。 Sen表示:“普及机器学习的方式就是让它可以非常轻松地与系统对接。”Sen将在NIPS大会上主持一个题为机器学习与系统设计交集的工作坊。“我们试着隐藏所有困难的步骤。” 微软多年来一直在为诸如决策服务这样的系统开发构建块。一直致力于该领域的研究、在微软纽约研究院进行博士后研究工作的Sarah Bird表示,该系统目前的能力甚至在几年前都是无法实现的。
Sarah Bird Bird现在是微软Azure部门的技术顾问,她表示,这样的系统之所以快速发展,是因为机器学习所需的所有元素——云的计算能力、算法和数据——同时都在迅速发展。 她说:“看到我们所需的所有组件同时迈向成熟确实令人惊喜。无论对于消费者、开发者还是研究者来说,这都是个美好时代。” 快节奏变化 许多研究人员表示,强化学习有很远大的前景,因为它能够用来创建可做出独立和复杂决策的人工智能系统,以增强和弥补人类自身的能力。 研究人员提醒,他们仍然处于寻找强化学习成功之路的早期阶段,但是他们表示到目前为止看到的状况非常有前景。 微软剑桥研究院研究员Katja Hofmann表示:“关于究竟能达成什么目标的感觉是在不断变化的,这恰是最让我感到激动之处。” Hofmann领导了Project Malmo,该。 最近,Hofmann与同事一起研究让人工智能代理做多项任务而不是一项任务的方式,同时把它们完成一个任务的经验运用于另一项任务。例如,运行在《我的世界》某个空间的人工智能系统可以学会识别熔岩,然后利用这一知识在另一个空间躲避其它熔岩。这一研究的部分成果也在欧洲强化学习研讨会(European Workshop on Reinforcement Learning)上展示,这一会议与NIPS同在西班牙举行。 机器学习新范式 除了上文提到的这些已有的机器学习范式之外,来自微软亚洲研究院的研究员还积极探索了其他的可能性。例如在Dual Learning for MachineTranslation这篇论文中,研究员提出了一种新的机器学习范式:对偶学习。 对偶学习的基本思想是两个对偶的任务能形成一个闭环反馈系统,使我们得以从未标注的数据上获得反馈信息,atv,进而利用该反馈信息提高对偶任务中的两个机器学习模型。该思想具有普适性,可以扩展到多个相关任务上面,前提是只要它们能形成一个闭环反馈系统。具体内容可见《》。 了解更多微软出席NIPS的信息,请点击阅读原文或浏览器中打开(https://www.microsoft.com/en-us/research/event/nips-2016-microsoft-research/) 你也许还想看:
感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:[email protected]。 微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。 (责任编辑:本港台直播) |