xyhk96

这家伙很懒，什么都没留下

X

X xyhk96 这家伙很懒，什么都没留下

发布于2022-09-05 16:46:22

请问下卢宗青老师报告中的四篇论文有原文吗，想参考看看，没找到原文
Su et al.,A Minimalist Approach to Decentralized Multi-Agent Reinforcement Learning,2022 Jiang and Lu, 12Q: A fully decentralize...

赞

评论 1

浏览 1161

水区
X

X xyhk96 这家伙很懒，什么都没留下

发布于2021-12-08 10:02:21

各位大佬们，我想知道，在多智能体强化学习中，如果智能体之间的动作存在一定的约束，多智能体强化学习还能够实现吗，比如，假设有智能体1,2,3,4，他们的动作满足a1+a2+a3+a4=100，这种是不是无法通过分布式多智能体来实现，必须采用一个集中式控制器来保证约束吗？

赞

评论 9

浏览 1656

课程学习
X

X xyhk96 这家伙很懒，什么都没留下

发布于2021-12-03 22:44:57

张崇洁老师的《DOP: Off-Policy Multi-Agent Decomposed Policy Gradients》论文研讨
最近在研究多智能体强化学习，有大佬阅读过这篇论文吗，每个智能体 i 的局部 Q 函数的参数 Φi 是如何通过梯度的反向传播来学习到的，可以具体讲解下吗？我看在伪代码的参数初始化中，没有指出每个智能体 i 具有一个单独的神经网络来逼近自身的局部 Q 函数，只...

赞 5

评论

浏览 1663

论文研讨