- 发布于2022-05-16 18:48:02
混合动作空间|揭秘创造人工智能的黑魔法(1)
OpenDILab 新开设了混合动作空间专栏,将从离散动作空间和连续动作空间入手,为大家介绍混合动作空间的起源和发展,并解读一系列学术界相关 paper。 本文作为混合动作空间系列专题文章的第一篇,主要是介绍混合动作空间的类型以及经典环境。 近年来,强化学...赞 1评论浏览 1188 - 发布于2022-05-27 12:51:30
混合动作空间|揭秘创造人工智能的黑魔法(2)
引言: 我们之前的一篇文章(混合动作空间 | 揭秘创造人工智能的黑魔法(1))中,详细地介绍了强化学习目前常见的动作空间类型,如离散动作、连续动作、混合动作等。本文则将以游戏环境为例,介绍如何对强化学习的动作空间进行预处理(action space sha...赞 1评论浏览 1078 - 发布于2022-05-31 15:08:52
混合动作空间|揭秘创造人工智能的黑魔法(3)
在前两篇博客中,我们介绍了深度强化学习的动作空间定义和常见的预处理方法。 混合动作空间 | 揭秘创造人工智能的黑魔法(1) 混合动作空间 | 揭秘创造人工智能的黑魔法(2) 过去的强化学习研究大部分都关注离散动作和连续动作问题,但由于混合动作空间在诸多真实...赞 1评论浏览 2002