RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
sisi_zhou

sisi_zhou

这家伙很懒,什么都没留下

个人成就
  • 积分
    9
  • 帖子
    3
  • 评论
    6
  • 注册排名
    235
  • 关注了
    6
  • 关注者
    1
  • 帖子
  • 文章
  • sisi_zhou
    sisi_zhou sisi_zhou 这家伙很懒,什么都没留下
    发布于2022-04-22 10:26:09

    多智能体强化学习环境

    想问一下大家,除了 MAgent 外,是否还有其他用高维数据(图像)作为输入的多智能体环境。
    赞
    评论 3
    浏览 1224
    水区
  • sisi_zhou
    sisi_zhou sisi_zhou 这家伙很懒,什么都没留下
    发布于2021-11-20 16:03:42

    强化学习自博弈训练过程中的评价指标

    近期,对杨老师的 MFRL 方法很感兴趣,故下载源码进行实验,在 Battle Game 场景中,使用自博弈的方式进行训练,对同一种方法,如 MFQ,使用不同的超参数,最终奖励函数均可收敛,但是性能却有所差别。在训练时发现,可能会有两种情况,1:对抗双方势...
    赞 1
    评论 5
    浏览 1665
    水区
  • sisi_zhou
    sisi_zhou sisi_zhou 这家伙很懒,什么都没留下
    发布于2021-11-18 23:41:50

    Mean-field Multi-agent Reinforcemen Learning代码复现问题讨论t

    关于 battle game 场景,代码复现时候出现以下问题,希望各位可以多多指教。 1 玻尔兹曼探索策略,训练阶段,temperature 的值从 1 到 0.05 线性衰减,在测试阶段的 temperature 应该设为多少呢?是 1 还是 0.05 ...
    赞 1
    评论 2
    浏览 1241
    论文研讨
关于 标签 友链