RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
王卓
这家伙很懒,什么都没留下
个人成就
积分
1
帖子
1
评论
0
注册排名
2378
关注了
0
关注者
0
帖子
文章
王卓
这家伙很懒,什么都没留下
发布于2023-11-07 16:05:37
RL和域泛化相结合
如题,域泛化和强化学习最容易想到的就是在 A 域上先训练出一个模型,然后设定强化学习 agent 通过对 B 域不断探索,找到一个最优策略,这应该是最简单的想法,但在 22 年的域泛化综述上只提到了机器人的 control 问题,而在 23 年论文里也没有...
赞
评论
浏览
601
经验分享
到底啦