- 发布于2022-06-27 17:30:00
RL方向招聘 | “启元实验室”招聘强化学习英才
关于实验室 启元实验室成立于 2020 年 7 月,由北京市人民政府设立,是北京市新型研发机构、独立事业法人科研单位,依托清华大学建设、运行与管理。实验室聚焦智能科技领域科研攻关,立足“体现国家意志,服务国家战略,承担国家使命,代表国家水平”的定位,以勇闯...赞 5评论 15浏览 1991 -
上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
发布于2022-11-30 16:27:27产业速递|数字世界里的足球——数研院探索多智能体足球AI并取得新突破
世界杯终于回来了,经历了疫情的三年时光,全世界的球迷都尤其期盼着这个也许是人类历史上意义仅次于 1948 年伦敦奥运会的盛大赛事——2022 卡塔尔世界杯。 1863 年,英国足球协会在伦敦正式成立,标志着真正意义上的现代足球诞生了。在这一百多年的发展中,...赞 1评论 1浏览 257 - 赞评论 8浏览 804
- 赞评论 1浏览 555
- 发布于2022-04-22 10:26:09赞评论 3浏览 386
- 发布于2022-03-07 02:52:21赞 5评论 3浏览 677
- 发布于2021-12-22 11:23:02赞 1评论 3浏览 848
- 发布于2021-11-30 21:05:20
MARL真的需要centralised training吗?
Centralised training decentralised execution 似乎已经成为开发现今多智能体强化学习 MARL 算法的唯一范式,基于 CTDE 的各种变形也是花样繁多(例如 MADDPG, COMA, VDN, QMIX)。但事实...赞 12评论 3浏览 2577 - 赞评论浏览 344
- 赞评论浏览 503
- 发布于2021-10-15 16:48:53
多智能体强化学习: 最小方差策略梯度
知乎链接 https://zhuanlan.zhihu.com/p/421389019 文章翻译自 https://hackmd.io/rkNojzNzQzWXlU0HoaPOrg?view 论文出自 NeurIPS 2021 "Settling the ...赞 4评论浏览 761 - 发布于2022-03-02 05:44:26赞 3评论浏览 554
- 发布于2022-02-28 22:26:57赞 6评论 2浏览 780