RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
cloudpetticoats
cs在读研究生
个人成就
积分
1
帖子
1
评论
0
注册排名
2960
关注了
0
关注者
0
帖子
文章
cloudpetticoats
cs在读研究生
发布于2024-11-28 22:39:45
DQN求解优化问题总收敛到边界值?
大佬们,我正在用 GAT+DQN 求解一个离散优化问题,action 是 n 维的二进制变量(n 会变化,所以用 GAT),优化目标设定为一个正的即时奖励,还有两个约束,不满足约束会给一个大的负奖励,用 epsilong-greedy 随机探索二进制变量。...
赞
评论
浏览
97
水区
到底啦