RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
无法解出的问题

无法解出的问题

钝学累功,不妨精熟。

https://blog.csdn.net/Vincent_Ethan_Lyq?spm=1000.2116.3001.5343
个人成就
  • 积分
    24
  • 帖子
    1
  • 评论
    1
  • 注册排名
    175
  • 关注了
    1
  • 关注者
    0
  • 帖子
  • 文章
  • 无法解出的问题
    无法解出的问题 无法解出的问题 钝学累功,不妨精熟。
    发布于2021-10-12 17:55:30

    我们从回放池中采样得到数据来训练,但是这些数据可能并不是来自于同一个策略 ,为什么也可以用来训练?这种异策学习对训练有什么影响?

    学习 RL 不久,对于 Experience Replay 中的异策数据这点有疑问(如题所示),网上也没有找到比较满意的解释,论文也比较少,而且大多数都关注于回放池的容量对学习的影响。 Fedus, William, et al. "Revisiting...
    赞
    评论 1
    浏览 952
    水区
关于 标签 友链