sisi_zhou

这家伙很懒，什么都没留下

sisi_zhou 这家伙很懒，什么都没留下

发布于2022-04-22 10:26:09

多智能体强化学习环境
想问一下大家，除了 MAgent 外，是否还有其他用高维数据（图像）作为输入的多智能体环境。

赞

评论 3

浏览 1666

水区
sisi_zhou 这家伙很懒，什么都没留下

发布于2021-11-20 16:03:42

强化学习自博弈训练过程中的评价指标
近期，对杨老师的 MFRL 方法很感兴趣，故下载源码进行实验，在 Battle Game 场景中，使用自博弈的方式进行训练，对同一种方法，如 MFQ，使用不同的超参数，最终奖励函数均可收敛，但是性能却有所差别。在训练时发现，可能会有两种情况，1：对抗双方势...

赞 1

评论 5

浏览 2110

水区
sisi_zhou 这家伙很懒，什么都没留下

发布于2021-11-18 23:41:50

Mean-field Multi-agent Reinforcemen Learning代码复现问题讨论t
关于 battle game 场景，代码复现时候出现以下问题，希望各位可以多多指教。 1 玻尔兹曼探索策略，训练阶段，temperature 的值从 1 到 0.05 线性衰减，在测试阶段的 temperature 应该设为多少呢？是 1 还是 0.05 ...

赞 1

评论 2

浏览 1639

论文研讨