RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
小
小丶马
这家伙很懒,什么都没留下
个人成就
积分
1
帖子
1
评论
0
注册排名
1667
关注了
0
关注者
0
帖子
文章
小
小
小丶马
这家伙很懒,什么都没留下
发布于2023-02-22 20:30:48
请教一下关于动作边界值的问题。
假如我的动作空间是开区间(-1,1),并且采用的是 PPO 算法,那我要怎么避免智能体取到边界值-1 和 1 呢?常用的方法有哪些诶?
赞
1
评论
浏览
784
经验分享
到底啦