- 赞评论浏览 42
- 赞评论 1浏览 473
- 发布于2023-10-11 15:27:42
一文七问 | 论文分享:大规模多智能体系统的分层均值场深度强化学习
@toc 导读 本篇推文将为大家介绍中山大学余超老师于 2023 AAAI 发表的一篇论文: Hierarchical Mean-Field Deep Reinforcement Learning for Large-Scale Multiagent Sy...赞 2评论 6浏览 1427 - 发布于2024-03-24 12:58:40
圆桌论道 | ICLR 2024 强化学习和 LLM 相关573篇论文整理
圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 国际学习表征会议(International Conference on Learning Representations, 简称 ICLR)是计算机...赞 12评论 2浏览 6618 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2024-03-18 11:56:27
南栖仙策提出高相容性协作算法 ,保障智能体与开放环境中多样甚至未见的队友高效协作
开放环境的机器学习是目前的研究难点与热点,是算法落地的关键之一。其中,开放环境的多智能体强化学习与人智协同方向需要智能体与各种多样甚至是未见的队友策略进行高效协作。为了达成这一目标,主流方法在训练阶段生成若干队友策略与智能体配对训练以提高智能体的协作能力。...赞 1评论浏览 475