RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
Yi-Ci
这家伙很懒,什么都没留下
个人成就
积分
3
帖子
1
评论
2
注册排名
499
关注了
2
关注者
0
帖子
文章
Yi-Ci
这家伙很懒,什么都没留下
发布于2023-11-01 23:51:42
Help~
请教一个问题,“After RL training, 得到的模型中可能包括多个最优解(Policy)和一个 value function。”这个结论是否正确。
赞
评论
3
浏览
416
论文研讨
到底啦