发布于2024-12-31 02:20:20
NeurIPS 2024 | DACER:扩散模型与在线强化学习强强联合创造新SOTA!
本文介绍清华大学智能驾驶课题组(iDLab)在 NeurIPS 2024 发表的最新研究成果《Diffusion Actor-Critic with Entropy Regulator》。该算法创新性地将扩散模型的反向过程作为策略函数,使在线强化学习算法能...赞
1
评论
浏览
189