王卓

这家伙很懒，什么都没留下

王卓这家伙很懒，什么都没留下

发布于2023-11-07 16:05:37

RL和域泛化相结合
如题，域泛化和强化学习最容易想到的就是在 A 域上先训练出一个模型，然后设定强化学习 agent 通过对 B 域不断探索，找到一个最优策略，这应该是最简单的想法，但在 22 年的域泛化综述上只提到了机器人的 control 问题，而在 23 年论文里也没有...

赞

评论

浏览 1219

经验分享