RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
Dixit
这家伙很懒,什么都没留下
个人成就
积分
2
帖子
1
评论
1
注册排名
75
关注了
1
关注者
0
帖子
文章
Dixit
这家伙很懒,什么都没留下
发布于2021-10-07 17:06:54
方差缩减术
目前我所知的方差缩减技术有 3 类: 1、Baseline 方法; 2、TD 方法; 3、Reparameterization 方法; 欢迎补充其他的方差缩减方法~ 另外在 actor loss 中,是否可以导出像机器学习中的那种 bias-varianc...
赞
2
评论
1
浏览
1018
经验分享
到底啦