RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
李

李海

这家伙很懒,什么都没留下

个人成就
  • 积分
    1
  • 帖子
    1
  • 评论
    0
  • 注册排名
    742
  • 关注了
    0
  • 关注者
    0
  • 帖子
  • 文章
  • 李
    李 李海 这家伙很懒,什么都没留下
    发布于2022-05-20 21:15:53

    深度强化学习中神经网络的收敛问题?

    各位老师和同学好,最近研究遇到一个疑惑,想发帖求助一下社区中的大神。 问题:强化学习中更新 Q 网络或者策略网络一般有期望更新和采样更新两种方式,我对于采样更新有一个疑问就是在采样的过程中伴随着随机性,这种随机性将直接导致 Q 值网络或者策略网络不能很好的...
    赞
    评论
    浏览 1226
    水区
关于 标签 友链