浩然

这家伙很懒，什么都没留下

浩

浩浩然这家伙很懒，什么都没留下

发布于2021-09-28 17:27:33

基于模型的强化学习中，如果使用概率模型，为什么不需要考虑输出状态各维之间的协方差？
基于模型的强化学习中，如果使用概率模型，如 MBPO。如果将模型输出定义为一个多维高斯分布，为什么都没有考虑输出的各个维度之间的协方差呢？（也就是假设协方差为对角阵)请问这样仅仅是为了简化模型吗？感谢各位老师同学的解答

赞 4

评论 5

浏览 784

论文研讨