RLChina 强化学习社区

发动态
发帖子

话题

发动态
发帖子

sheldon123z

这家伙很懒，什么都没留下

个人成就

积分
3
帖子
1
评论
2
注册排名
1545

关注了
4
关注者
0

帖子
文章

sheldon123z 这家伙很懒，什么都没留下

发布于2022-11-22 13:46:47

On-Policy Approximation -1 强化学习Sutton第9章部分总结
On-Policy Approximation 均值方差公式： \overline{\mathrm{VE}}(\mathbf{w}) \doteq \sum_{s \in \mathcal{S}} \mu(s)\left[v_\pi(s)-\hat{v}(...

赞 1

评论

浏览 987

水区

关于标签友链