RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
cloudpetticoats

cloudpetticoats

cs在读研究生

个人成就
  • 积分
    1
  • 帖子
    1
  • 评论
    0
  • 注册排名
    2960
  • 关注了
    0
  • 关注者
    0
  • 帖子
  • 文章
  • cloudpetticoats
    cloudpetticoats cloudpetticoats cs在读研究生
    发布于2024-11-28 22:39:45

    DQN求解优化问题总收敛到边界值?

    大佬们,我正在用 GAT+DQN 求解一个离散优化问题,action 是 n 维的二进制变量(n 会变化,所以用 GAT),优化目标设定为一个正的即时奖励,还有两个约束,不满足约束会给一个大的负奖励,用 epsilong-greedy 随机探索二进制变量。...
    赞
    评论
    浏览 265
    水区
关于 标签 友链