RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
董

董淼

这家伙很懒,什么都没留下

个人成就
  • 积分
    3
  • 帖子
    1
  • 评论
    2
  • 注册排名
    1952
  • 关注了
    0
  • 关注者
    0
  • 帖子
  • 文章
  • 董
    董 董淼 这家伙很懒,什么都没留下
    发布于2023-03-24 17:44:42

    学习张伟楠老师《动手学强化学习》中GAIL代码的问题

    各位社区的同学和老师们好,我想请教一下,张伟楠老师书中给出的 GAIL 实例代码中专家轨迹只有一条,那如果是复杂环境需要多条轨迹的话,判别器的数据输入那里要怎么处理呢?生成器生成的一个完整过程的状态动作对要和哪一条专家轨迹进行判别呢?
    赞 1
    评论
    浏览 603
    水区
关于 标签 友链