徐盈辉:「强化学习」技术的应用场景广泛,市场空间巨大,从游戏 AI、围棋博弈、自动驾驶汽车、机器人控制,到电商推荐、工业智能制造、新能源发电、调度管理,都可以找到应用的场景,去实现能够让机器算法像人一样学习、思考、决策。 机器之心:您最近重点关注的技术点有哪些?阿里在强化学习方向上还有哪些着重解决的问题?应用方向上会有重要突破点吗? 徐盈辉:仍然会持续关注强化学习方向的新进展和突破,基于逆强化学习、迁移学习来更合理地刻画奖赏函数、多智能强化学习,目前我们的研究还是停留在单智能体的强化学习,而对于电商平台,如果把我们商家,消费者都应该看成智能体,这样就形成了一个非完全信息下的 multi-agent learning(笔者注:多智能体学习)问题,如何设计有效算法体系来实现平台智能体,用户智能体之间的 coordination 也是一个值得考虑和研究的方向。目前阿里在强化学习上着重解决的问题是基于新一代硬件体系和网络环境下的大规模分布式在线机器学习框架的研发。应用方向上的会着力尝试结合商业不完全信息环境下的多智能体强化学习,基于 GAN 算法框架下的生成式模型在搜索推荐场景下的应用。 ©本文为机器之心原创,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |