RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
Haitham Bou Ammar
Haitham Bou Ammar RL team leader @Huawei R&D UK & UCL H. Assistant Prof.
发布于 2022-03-02 22:47:19

Iterated Law of Expectation Consice Proof (6 simple steps)

课程学习 #离线强化学习#多智能体强化学习#ml-agents
Jun Wang 汪军Double QRLChina
浏览 (1361) 点赞 (3) 收藏
评论(1)
请 登录后发表观点
  • Willing Star
    Willing Star 2023-07-11 19:41:42 回复

    I think the R.H.S. is better written as E[E[Y|X=x,Z]|X=x], because Z is also a random variable.

Haitham Bou Ammar
Haitham Bou Ammar
RL team leader @Huawei R&D UK & UCL H. Assistant Prof.
  • 关注了
    4
  • 关注者
    17
  • 积分
    8
  • 注册排名
    539
关于 标签 友链