强化学习的动作空间是离散-连续混合，而且周期决策，应该如何实现？

米祈睿 2022-05-05 16:30:31 回复

不太明白，拍动的幅值为什么要设定为离散空间，难道连续的不是更 fit 吗？
米祈睿 2022-05-05 16:28:09 回复

不太懂分层强化学习指的是什么呢？前面动作选择，其实是 complex action space 的问题，下图中总结了在 complex action 下的一些工作，可以从这篇 paper 的 reference 里去索引：Action Space Shaping in Deep Reinforcement Learning
chenvy 2022-04-30 10:19:18 回复

伯禹人工智能学院之--参数学习
https://www.boyuai.com/elites/course/xVqhU42F5IDky94x