RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
F
Fox
这家伙很懒,什么都没留下
个人成就
积分
2
帖子
1
评论
1
注册排名
2253
关注了
1
关注者
0
帖子
文章
F
F
Fox
这家伙很懒,什么都没留下
发布于2023-09-01 21:42:49
奖励设置问题
环境是一个图网络,其中,规定了起点、终点和最大行驶距离(路径的权重和)。现在每条边上都有一个信息量可收集,我们期望在已有约束下最大化信息量收集。 目前的做法是 将下一个动作获取的信息量(即下一步走过的边上的信息量)作为奖励。 现在在训练中发现,由于所有合法...
赞
3
评论
2
浏览
634
水区
到底啦