RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
浩
浩然
这家伙很懒,什么都没留下
个人成就
积分
3
帖子
1
评论
2
注册排名
67
关注了
0
关注者
0
帖子
文章
浩
浩
浩然
这家伙很懒,什么都没留下
发布于2021-09-28 17:27:33
基于模型的强化学习中,如果使用概率模型,为什么不需要考虑输出状态各维之间的协方差?
基于模型的强化学习中,如果使用概率模型,如 MBPO。如果将模型输出定义为一个多维高斯分布,为什么都没有考虑输出的各个维度之间的协方差呢?(也就是假设协方差为对角阵)请问这样仅仅是为了简化模型吗?感谢各位老师同学的解答
赞
4
评论
5
浏览
543
论文研讨
到底啦