RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 戴扬
    戴扬 戴扬 = 。=
    发布于2天前

    RLChina 论文研讨会第124期(2025.07.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 124 期论文研讨会将由国防科技大学系统工程学院博士生戴扬主持,国防科技大学理学院王琦副教授为大家分享最新的研究工作...
    赞
    评论
    浏览 77
    论文研讨
  • 王
    王 王梓岩 这家伙很懒,什么都没留下
    发布于9天前

    RLChina 论文研讨会第123期(2025.7.15直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 123 期论文研讨会将由伦敦国王学院博士生王梓岩主持,卡内基梅隆大学 张志成, 吉林大学 郭思源,为大家分享最新的研...
    赞
    评论
    浏览 114
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于13天前

    大模型社会模拟新突破:中科院团队提出MF-LLM框架,实现动态群体行为高保真模拟

    本文第一作者 米祈睿 ,中科院自动化所博士生(导师:汪军、张海峰老师),现于南洋理工大学安波教授团队访问,研究方向为群体智能体决策(LLM/RL)及基于智能体的经济仿真。 1. 大模型社会模拟的机遇与挑战 随着大语言模型(LLM)技术的快速发展,社会模拟研...
    赞 3
    评论
    浏览 1498
    论文研讨
  • C
    C castor_v_pollux 这家伙很懒,什么都没留下
    发布于17天前

    RLChina 论文研讨会第122期(2025.7.8直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 122 期论文研讨会将由北京大学博士生鲁云龙主持,北京大学博士生马允轩为大家分享最新的研究工作,欢迎大家参与。 互动...
    赞
    评论
    浏览 121
    论文研讨
  • 汤
    汤 汤楠-NJU 这家伙很懒,什么都没留下
    发布于2025-06-19 11:20:52

    RLChina 论文研讨会第121期 (2025.6.24直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 121 期论文研讨会将由南京大学博士生汤楠主持,南京大学硕士生王一迪、南京大学本科生杨博涵为大家分享最新的研究工作,...
    赞
    评论 1
    浏览 256
    论文研讨
  • 薛
    薛 薛正海-NTU 这家伙很懒,什么都没留下
    发布于2025-06-16 23:48:56

    RLChina 论文研讨会第120期 (2025.6.17直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 120 期论文研讨会将由新加坡南洋理工大学博士生俸朗为大家分享最新的研究工作,欢迎大家参与。 互动方式:在本帖留言,...
    赞
    评论
    浏览 276
    论文研讨
  • Z
    Z zhengrong 这家伙很懒,什么都没留下
    发布于2025-06-06 14:31:10

    RLChina 论文研讨会第119期 (2025.6.10直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 119 期论文研讨会将由清华大学胡开哲主持,清华大学陆伊炀、上海交通大学郭凌霄为大家分享最新的研究工作,欢迎大家参与。 互动方式:在...
    赞
    评论
    浏览 300
    论文研讨
  • YanSong
    YanSong YanSong 这家伙很懒,什么都没留下
    发布于2025-05-31 03:08:31

    RLChina 论文研讨会第118期(2025.6.3直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 118 期论文研讨会将由伦敦大学学院博士生宋研主持,中国科学院自动化研究所博士生孙罗阳、 华为诺亚伦敦实验室研究科学...
    赞
    评论
    浏览 309
    论文研讨
  • KRHKK
    KRHKK KRHKK 这家伙很懒,什么都没留下
    发布于2025-05-25 19:30:35

    RLChina 论文研讨会第117期(2025.5.27直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 117 期论文研讨会将由中科院自动化研究所博士生孙罗洋主持,中科院自动化所博士生 闫雪 和 清华大学硕士生 牛浩懿 ...
    赞
    评论
    浏览 370
    论文研讨
  • Z
    Z Zhengbang Zhu 这家伙很懒,什么都没留下
    发布于2025-05-14 18:25:38

    RLChina 论文研讨会第116期(2025.5.20直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 116 期论文研讨会将由上海交通大学博士生竺正邦主持,上海交通大学博士生陈竞潇和上海交通大学本科生韩潇申为大家分享最...
    赞
    评论
    浏览 287
    论文研讨
  • H
    H harry 这家伙很懒,什么都没留下
    发布于2025-05-10 11:23:02

    RLChina 论文研讨会第115期(2025.5.13直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 115 期论文研讨会将由中国科学技术大学博士生宋昊霖主持, 中国科学技术大学博士生耿子介、王泓为大家分享最新的研究工...
    赞
    评论
    浏览 301
    论文研讨
  • 刘
    刘 刘金毅 这家伙很懒,什么都没留下
    发布于2025-04-23 11:05:31

    RLChina 论文研讨会第114期(2025.4.29直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 114 期论文研讨会将由天津大学博士生刘金毅主持,天津大学博士生刘金毅、天津大学硕士生程荣、天津大学硕士生崔海勤为大...
    赞 1
    评论
    浏览 420
    论文研讨
  • Criswim
    Criswim Criswim 这家伙很懒,什么都没留下
    发布于2025-04-17 20:11:08

    RLChina 论文研讨会第113期(2025.04.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 114 期论文研讨会将由清华大学自动化系博士生毛逸休主持,清华大学自动化系博士生曲云为大家分享最新的研究工作,欢迎大...
    赞 1
    评论
    浏览 404
    论文研讨
  • C
    C castor_v_pollux 这家伙很懒,什么都没留下
    发布于2025-03-31 02:46:47

    RLChina 论文研讨会第112期(2025.4.1直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 112 期论文研讨会将由北京大学博士生鲁云龙主持,北京大学博士生袁昊琦和北京大学本科生黄子烨为大家分享最新的研究工作...
    赞
    评论 1
    浏览 422
    论文研讨
  • 薛
    薛 薛正海-NTU 这家伙很懒,什么都没留下
    发布于2025-03-17 10:57:53

    RLChina 论文研讨会第110期 (2025.3.18直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 110 期论文研讨会将由新加坡南洋理工大学博士生李晔文和薛正海为大家分享最新的研究工作,欢迎大家参与。 互动方式:在...
    赞
    评论 1
    浏览 529
    论文研讨
  • 汤
    汤 汤楠-NJU 这家伙很懒,什么都没留下
    发布于2025-03-18 11:28:48

    RLChina 论文研讨会第111期 (2025.3.25直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 111 期论文研讨会将由南京大学博士生汤楠主持,南京大学博士生王鹏远、南京大学博士生林浩鑫和南京大学博士生汤楠为大家...
    赞 1
    评论
    浏览 402
    论文研讨
  • 自动化所姜纪文
    自动化所姜纪文 自动化所姜纪文 (ง •_•)ง
    发布于2023-10-11 15:27:42

    一文七问 | 论文分享:大规模多智能体系统的分层均值场深度强化学习

    @toc 导读 本篇推文将为大家介绍中山大学余超老师于 2023 AAAI 发表的一篇论文: Hierarchical Mean-Field Deep Reinforcement Learning for Large-Scale Multiagent Sy...
    赞 5
    评论 8
    浏览 2346
    论文研讨
  • Z
    Z zhengrong 这家伙很懒,什么都没留下
    发布于2025-01-20 11:45:05

    RLChina 论文研讨会第109期 (2025.1.21直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 109 期论文研讨会将由清华大学薛峥嵘主持,斯坦福大学黄苏宁、卡内基梅隆大学张远航为大家分享最新的研究工作,欢迎大家参与。 互动方式...
    赞
    评论
    浏览 499
    论文研讨
  • YanSong
    YanSong YanSong 这家伙很懒,什么都没留下
    发布于2025-01-12 18:17:54

    RLChina 论文研讨会第108期(2024.01.14直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 108 期论文研讨会将由伦敦大学学院博士生宋研主持,天工 Skywork 研究科学家王超杰、吉林大学博士生郭思源,为...
    赞
    评论
    浏览 526
    论文研讨
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2025-01-10 10:22:00

    RNN策略训练稳定性提升秘籍:给RNN设置单独的学习率

    在实际的决策任务中,信息常常是受限的,我们常常只能基于局部的信息进行决策或控制。例如在机器人操控的场景下,机器人只能观测到摄像头视角内的物体。现有的研究工作通常会结合历史的观测来补齐缺失的信息。循环强化学习(recurrent RL)使用循环神经网络来对历...
    赞
    评论
    浏览 439
    论文研讨
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    963
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • R
    Rlxia

    0 帖子 • 0 评论

    568
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链