- 发布于2023-08-08 10:40:17
大规模多智能体学习
大家好,向大家咨询一些问题,智能体数量达到百万级别在多智体强化学习领域是可行的吗?有推荐的案例吗?比如一些论文或者应用? Hi guys, a few questions for you, is millions of agents feasible in...赞评论 1浏览 558 - 发布于2022-03-07 02:52:21赞 8评论 4浏览 1235
- 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。发布于2022-11-30 16:27:27
产业速递|数字世界里的足球——数研院探索多智能体足球AI并取得新突破
世界杯终于回来了,经历了疫情的三年时光,全世界的球迷都尤其期盼着这个也许是人类历史上意义仅次于 1948 年伦敦奥运会的盛大赛事——2022 卡塔尔世界杯。 1863 年,英国足球协会在伦敦正式成立,标志着真正意义上的现代足球诞生了。在这一百多年的发展中,...赞 1评论 1浏览 602 - 赞评论 8浏览 1420
- 赞评论 1浏览 997
- 发布于2022-04-22 10:26:09赞评论 3浏览 769
- 发布于2021-12-22 11:23:02赞 2评论 3浏览 1187
- 发布于2021-11-30 21:05:20
MARL真的需要centralised training吗?
Centralised training decentralised execution 似乎已经成为开发现今多智能体强化学习 MARL 算法的唯一范式,基于 CTDE 的各种变形也是花样繁多(例如 MADDPG, COMA, VDN, QMIX)。但事实...赞 12评论 3浏览 3233 - 赞评论浏览 654
- 赞评论浏览 832
- 发布于2021-10-15 16:48:53
多智能体强化学习: 最小方差策略梯度
知乎链接 https://zhuanlan.zhihu.com/p/421389019 文章翻译自 https://hackmd.io/rkNojzNzQzWXlU0HoaPOrg?view 论文出自 NeurIPS 2021 "Settling the ...赞 4评论浏览 1093 - 发布于2022-02-28 22:26:57赞 6评论 2浏览 1107