RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
因果与Markov

因果与Markov

这家伙很懒,什么都没留下

个人成就
  • 积分
    4
  • 帖子
    1
  • 评论
    2
  • 注册排名
    423
  • 关注了
    0
  • 关注者
    0
  • 帖子
  • 文章
  • 因果与Markov
    因果与Markov 因果与Markov 这家伙很懒,什么都没留下
    发布于2021-12-13 21:48:17
    就目前我所看到的model-based方法中,对于transition model的建模(or估计)都是直接把数据(如果是图像就可能用个VAE提取latent vector)输入到神经网络(不管是MLP还是RNN也好)中,直接对这个转移分布P进行建模,但是这种方法必然是存在一些“不该有”的bias。这个“不该有”的bias可以通过单纯利用状态的Causal parent去对transition model进行建模从而消除,但是问题在于,如何去寻找这个Causal Parent呢?能不能寻找与建模同时进行呢?
    赞
    评论
    浏览 1097
    论文研讨
关于 标签 友链