RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
F

Fox

这家伙很懒,什么都没留下

个人成就
  • 积分
    2
  • 帖子
    1
  • 评论
    1
  • 注册排名
    2253
  • 关注了
    1
  • 关注者
    0
  • 帖子
  • 文章
  • F
    F Fox 这家伙很懒,什么都没留下
    发布于2023-09-01 21:42:49

    奖励设置问题

    环境是一个图网络,其中,规定了起点、终点和最大行驶距离(路径的权重和)。现在每条边上都有一个信息量可收集,我们期望在已有约束下最大化信息量收集。 目前的做法是 将下一个动作获取的信息量(即下一步走过的边上的信息量)作为奖励。 现在在训练中发现,由于所有合法...
    赞 3
    评论 2
    浏览 844
    水区
关于 标签 友链