张伟楠
上海交通大学副教授,研究强化学习、数据科学。
评论(11)
请
登录后发表观点
-
张老师您好,我想问一下,书中给出的 GAIL 实例代码中专家轨迹只有一条,那如果是复杂环境需要多条轨迹的话,判别器的数据输入那里要怎么处理呢?生成器生成的一个完整过程的状态动作对要和哪一条专家轨迹进行判别呢?
-
谢谢你的反馈。课件其实和上海交大 ACM 班强化学习课是一样的,不少学习的同学还是反应偏难了一些。
不难不难,千万别改简单了。我还觉得应该再多点理论推导呢。
-
请问伯禹上的视频内容和下载的 ppt 有出入,ppt 的原视频有嘛?
-
还请在 https://www.boyuai.com/rl 观看相关知识点的视频。
好的,谢谢张老师,视频之前有学习过,您的作品质量非常高,非常感谢您的回复
-
非常感谢,已经到手了张老师的《动手强化学习》,请问这里提到的张老师的录音怎样才能在 PPT 中听到呢?
还请在 https://www.boyuai.com/rl 观看相关知识点的视频。
-
非常感谢,已经到手了张老师的《动手强化学习》,请问这里提到的张老师的录音怎样才能在 PPT 中听到呢?
-
非常感谢,我已经购买了《动手学强化学习》
-
非常感谢