cloudpetticoats

cs在读研究生

cloudpetticoats cs在读研究生

发布于2024-11-28 22:39:45

DQN求解优化问题总收敛到边界值？
大佬们，我正在用 GAT+DQN 求解一个离散优化问题，action 是 n 维的二进制变量（n 会变化，所以用 GAT），优化目标设定为一个正的即时奖励，还有两个约束，不满足约束会给一个大的负奖励，用 epsilong-greedy 随机探索二进制变量。...

赞

评论

浏览 756

水区