漂流萍
流体力学+强化学习,USTCer
发布于

强化学习的动作空间是离散-连续混合,而且周期决策,应该如何实现?

评论(3)
  • 米祈睿
    米祈睿 回复

    不太明白,拍动的幅值为什么要设定为离散空间,难道 连续的不是更 fit 吗?

  • 米祈睿
    米祈睿 回复

    不太懂 分层强化学习指的是什么呢? 前面动作选择,其实是 complex action space 的问题,下图中总结了在 complex action 下的一些工作,可以从这篇 paper 的 reference 里去索引:Action Space Shaping in Deep Reinforcement Learning

  • chenvy
    chenvy 回复

    伯禹人工智能学院之--参数学习
    https://www.boyuai.com/elites/course/xVqhU42F5IDky94x