RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
Dixit

Dixit

这家伙很懒,什么都没留下

个人成就
  • 积分
    2
  • 帖子
    1
  • 评论
    1
  • 注册排名
    75
  • 关注了
    1
  • 关注者
    0
  • 帖子
  • 文章
  • Dixit
    Dixit Dixit 这家伙很懒,什么都没留下
    发布于2021-10-07 17:06:54

    方差缩减术

    目前我所知的方差缩减技术有 3 类: 1、Baseline 方法; 2、TD 方法; 3、Reparameterization 方法; 欢迎补充其他的方差缩减方法~ 另外在 actor loss 中,是否可以导出像机器学习中的那种 bias-varianc...
    赞 2
    评论 1
    浏览 1151
    经验分享
关于 标签 友链