增强学习是最近非常热门研究话题。由于最近加入增强学习的AlphaGo获得的巨大成功,它在自动驾驶等类似的系统的潜在作用得到重视,增强学习与深度学习的结合无疑被认为是“普遍AI”的重要角色。实际上这也是本书出第二版的原因。 这本书被简称为“Sutton and Barto”,很好地说明了它在增强学习领域的权威性。下面这则来自David Tan的亚马逊评论很好地总结了该书: 该书先是用一些例子直观地介绍了增强学习及它的定义。接下来的三章介绍了增强学习的三种基本方法:动态规划、蒙特卡洛和时间差分法。后续章节基于这些方法拓展到整个解决方案和算法。 :COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 (责任编辑:本港台直播) |