漂流萍
流体力学+强化学习,USTCer
评论(3)
请
登录后发表观点
-
不太明白,拍动的幅值为什么要设定为离散空间,难道 连续的不是更 fit 吗?
-
不太懂 分层强化学习指的是什么呢? 前面动作选择,其实是 complex action space 的问题,下图中总结了在 complex action 下的一些工作,可以从这篇 paper 的 reference 里去索引:Action Space Shaping in Deep Reinforcement Learning
-
伯禹人工智能学院之--参数学习
https://www.boyuai.com/elites/course/xVqhU42F5IDky94x