- 发布于26天前赞评论 3浏览 98
- 发布于2022-03-07 02:52:21赞 4评论 3浏览 330
- 发布于2021-12-22 11:23:02赞 1评论 3浏览 464
- 发布于2021-11-30 21:05:20
MARL真的需要centralised training吗?
Centralised training decentralised execution 似乎已经成为开发现今多智能体强化学习 MARL 算法的唯一范式,基于 CTDE 的各种变形也是花样繁多(例如 MADDPG, COMA, VDN, QMIX)。但事实...赞 12评论 3浏览 1036 - 发布于2021-10-15 16:48:53
多智能体强化学习: 最小方差策略梯度
知乎链接 https://zhuanlan.zhihu.com/p/421389019 文章翻译自 https://hackmd.io/rkNojzNzQzWXlU0HoaPOrg?view 论文出自 NeurIPS 2021 "Settling the ...赞 3评论浏览 397 - 赞评论浏览 44
- 发布于2022-03-02 05:44:26赞 3评论浏览 208
- 发布于2022-02-28 22:26:57赞 6评论 2浏览 312