RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
因果与Markov
这家伙很懒,什么都没留下
个人成就
积分
4
帖子
1
评论
2
注册排名
423
关注了
0
关注者
0
帖子
文章
因果与Markov
这家伙很懒,什么都没留下
发布于2021-12-13 21:48:17
就目前我所看到的model-based方法中,对于transition model的建模(or估计)都是直接把数据(如果是图像就可能用个VAE提取latent vector)输入到神经网络(不管是MLP还是RNN也好)中,直接对这个转移分布P进行建模,但是这种方法必然是存在一些“不该有”的bias。这个“不该有”的bias可以通过单纯利用状态的Causal parent去对transition model进行建模从而消除,但是问题在于,如何去寻找这个Causal Parent呢?能不能寻找与建模同时进行呢?
赞
评论
浏览
976
论文研讨
到底啦