小丶马

这家伙很懒，什么都没留下

小

小小丶马这家伙很懒，什么都没留下

发布于2023-02-22 20:30:48

请教一下关于动作边界值的问题。
假如我的动作空间是开区间（-1,1），并且采用的是 PPO 算法，那我要怎么避免智能体取到边界值-1 和 1 呢？常用的方法有哪些诶？

赞 1

评论

浏览 1366

经验分享