在本论文中,作者们表示虽然在线联合参数和状态估计是时间模型的核心问题并十分重要,但大多数现有的方法不是局限于特定类型的模型,就是计算量十分巨大。因此他们提出了一种全新的近似黑箱算法(nearly-black-box algorithm),这是一种用于状态变量的粒子滤波(particle filtering)和用于参数变量的预设密度滤波(assumed density filtering)的混合。因为该算法在计算上具有高效性,并适用于带有任意转变动态(transition dynamics)的离散和连续参数空间,作者表明算法在几种不同的模型都生成了更加精准的结果。 同样,直播,Russell 作为作者之一与第一作者Dylan Hadfield-Menell在去年的人工智能顶会 NIPS-2016 上发表了一篇协同反向强化学习(Cooperative Inverse Reinforcement Learning),该论文还有其他几篇强化学习论文(如 Q-Decomposition for Reinforcement Learning Agents 和 Algorithms for Inverse Reinforcement Learning 等)也在一定程度上表明了 Russell 比较关注于强化学习这一块。
在本论文中,作者们首先就阐明为了让自治系统(autonomous system)对人类有帮助,其需要在环境中令自身的价值与人类的价值相一致,从而自治系统的行为才能有助于人类价值的最大化。随后,作为协同反向强化学习(cooperative inverse reinforcement learning/CIRL),他们提出了值对齐问题(value alignment)的正式定义。他们的该研究表明,在 CIRL 博弈中能计算最优联合策略,并证明了孤立的最优性在 CIRL 中并不是最优的。 以上,机器之心简单地梳理了其研究论文,我们希望读者对 Russell 教授的研究能有一个大致的了解,并期望学术上硕果累累的 Russell 教授能在 GMIS 2017 大会上给我们带来不一样的思维盛宴。 参考文献 聚焦人工智能的未来,Russell 还想分享更多! Stuart Russell 有着丰富的研究经验,对人工智能的未来也有着细致的思考。在机器之心 GMIS 2017 全球机器智能峰会上,这位人工智能领域「标准教科书」的作者将会为我们带来更多人工智能技术和研究方面的精彩分享,这也是与顶级大牛近距离接触的不可多得机会。
2017 全球机器智能峰会(GMIS 2017)是由机器之心主办的关注全球人工智能及相关领域的行业盛会,将于 5 月 27 日至 28 日在北京 898 创新空间举行。为了让更多人工智能爱好者参与进来,我们也已经开启了免费赠票活动。 在文章《》下面留言,即有机会获得价值 2018 元的大会门票。 (责任编辑:本港台直播) |