RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
X

xyhk96

这家伙很懒,什么都没留下

个人成就
  • 积分
    8
  • 帖子
    3
  • 评论
    4
  • 注册排名
    394
  • 关注了
    1
  • 关注者
    1
  • 帖子
  • 文章
  • X
    X xyhk96 这家伙很懒,什么都没留下
    发布于2021-12-08 10:02:21
    各位大佬们,我想知道,在多智能体强化学习中,如果智能体之间的动作存在一定的约束,多智能体强化学习还能够实现吗,比如,假设有智能体1,2,3,4,他们的动作满足a1+a2+a3+a4=100,这种是不是无法通过分布式多智能体来实现,必须采用一个集中式控制器来保证约束吗?
    赞
    评论 9
    浏览 426
    课程学习
  • X
    X xyhk96 这家伙很懒,什么都没留下
    发布于2021-12-03 22:44:57

    张崇洁老师的《DOP: Off-Policy Multi-Agent Decomposed Policy Gradients》论文研讨

    最近在研究多智能体强化学习,有大佬阅读过这篇论文吗,每个智能体 i 的局部 Q 函数的参数 Φi 是如何通过梯度的反向传播来学习到的,可以具体讲解下吗?我看在伪代码的参数初始化中,没有指出每个智能体 i 具有一个单独的神经网络来逼近自身的局部 Q 函数,只...
    赞 5
    评论
    浏览 348
    论文研讨
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室