RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
X
xyhk96
这家伙很懒,什么都没留下
个人成就
积分
12
帖子
4
评论
7
注册排名
394
关注了
1
关注者
1
帖子
文章
X
X
xyhk96
这家伙很懒,什么都没留下
发布于2022-09-05 16:46:22
请问下卢宗青老师报告中的四篇论文有原文吗,想参考看看,没找到原文
Su et al.,A Minimalist Approach to Decentralized Multi-Agent Reinforcement Learning,2022 Jiang and Lu, 12Q: A fully decentralize...
赞
评论
1
浏览
784
水区
X
X
xyhk96
这家伙很懒,什么都没留下
发布于2021-12-08 10:02:21
各位大佬们,我想知道,在多智能体强化学习中,如果智能体之间的动作存在一定的约束,多智能体强化学习还能够实现吗,比如,假设有智能体1,2,3,4,他们的动作满足a1+a2+a3+a4=100,这种是不是无法通过分布式多智能体来实现,必须采用一个集中式控制器来保证约束吗?
赞
评论
9
浏览
1207
课程学习
X
X
xyhk96
这家伙很懒,什么都没留下
发布于2021-12-03 22:44:57
张崇洁老师的《DOP: Off-Policy Multi-Agent Decomposed Policy Gradients》论文研讨
最近在研究多智能体强化学习,有大佬阅读过这篇论文吗,每个智能体 i 的局部 Q 函数的参数 Φi 是如何通过梯度的反向传播来学习到的,可以具体讲解下吗?我看在伪代码的参数初始化中,没有指出每个智能体 i 具有一个单独的神经网络来逼近自身的局部 Q 函数,只...
赞
5
评论
浏览
1254
论文研讨
到底啦