论文研讨 - 话题 | RLChina 强化学习社区

J

J jiang 这家伙很懒，什么都没留下

发布于9天前

RLChina 论文研讨会第161期（2026.7.14直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 161 期论文研讨会将由中国科学技术大学博士生姜羿主持，中国科学技术大学硕士生段元瑞和中国科学技术大学博士生许鸢飞为...

赞

评论

浏览 81

论文研讨
I

I iffyuan 这家伙很懒，什么都没留下

发布于11天前

RLChina 论文研讨会第160期（2026.7.7直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 160 期论文研讨会将由天津大学博士生袁逸夫主持，天津大学硕士生赵刚毅、天津大学硕士生黄垚挺和天津大学硕士生陈义薄云...

赞

评论

浏览 75

论文研讨
G

G Guan_zh 这家伙很懒，什么都没留下

发布于20天前

RLChina 论文研讨会第159期（2026.6.30直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 159 期论文研讨会将由上海科技大学硕士生管振翰主持，并邀请到 UCL 博士生周辉池为大家分享他发表的工作，欢迎大家...

赞

评论

浏览 126

论文研讨
郝

郝郝瑞杰-国防科技大学这家伙很懒，什么都没留下

发布于27天前

RLChina 论文研讨会第158期（2026.6.23直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 158 期论文研讨会将由国防科技大学讲师梁星星主持，并邀请到上海交通大学博士生杨若峰为大家分享他发表的工作，欢迎大家...

赞

评论

浏览 237

论文研讨
胡紫灿-南京大学这家伙很懒，什么都没留下

发布于2026-06-15 11:24:58

RLChina 论文研讨会第157期（2025.6.16直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 157 期论文研讨会将由南京大学博士生胡紫灿主持，并邀请到复旦大学博士生宋明阳为大家分享他在 ICLR2026 发表...

赞

评论

浏览 190

论文研讨
王

王王梓岩这家伙很懒，什么都没留下

发布于2026-06-08 19:49:11

RLChina 论文研讨会第156期（2026.6.9直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 156 期论文研讨会将由伦敦国王学院博士生王梓岩主持，伦敦国王学院博士生赵佳宁和伦敦国王学院博士生郭子豪为大家分享最...

赞

评论

浏览 197

论文研讨
汤

汤汤楠-NJU 这家伙很懒，什么都没留下

发布于2026-05-24 11:02:58

RLChina 论文研讨会第155期（2026.5.26直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 155 期论文研讨会将由南京大学博士生汤楠主持，南京大学博士生王鹏远和南京大学博士生汤楠为大家分享最新的研究工作，欢...

赞

评论

浏览 274

论文研讨
K

K Kaizhe Hu 这家伙很懒，什么都没留下

发布于2026-05-18 10:30:24

RLChina 论文研讨会第154期（2026.5.19直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 154 期论文研讨会将由清华大学交叉信息研究院博士生胡开哲主持，光轮智能算法工程师张嘉伟和清华大学计算机系本科生康梓...

赞

评论

浏览 384

论文研讨
YanSong 这家伙很懒，什么都没留下

发布于2026-05-11 14:07:41

RLChina 论文研讨会第153期（2026.5.12直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 153 期论文研讨会将由伦敦大学学院博士生宋研主持，香港科技大学（广州）博士生张梦龙和香港科技大学（广州）博士生刘安...

赞

评论

浏览 727

论文研讨
J

J jiang 这家伙很懒，什么都没留下

发布于2026-04-23 22:55:45

RLChina 论文研讨会第152期（2026.4.28直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 152 期论文研讨会将由中国科学技术大学博士生姜羿主持，阿卜杜拉国王科技大学博士生马纬彧和中国科学技术大学博士生高显...

赞

评论

浏览 572

论文研讨
Z

Z Zhengbang Zhu 这家伙很懒，什么都没留下

发布于2026-04-19 13:48:56

RLChina 论文研讨会第151期（2026.4.21直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 151 期论文研讨会将由上海交通大学博士生竺正邦主持，上海交通大学博士生薛宇斐和上海自主智能无人系统科学中心博士生吕...

赞 1

评论 3

浏览 571

论文研讨
KRHKK 这家伙很懒，什么都没留下

发布于2026-04-13 00:00:47

RLChina 论文研讨会第150期（2026.4.14直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 150 期论文研讨会将由中科院自动化研究所博士生崔新宇主持，中科院自动化研究所博士生曾勇程和中国科学技术大学博士生谭...

赞

评论

浏览 452

论文研讨
胡紫灿-南京大学这家伙很懒，什么都没留下

发布于2026-03-12 00:30:41

RLChina 论文研讨会第146期（2025.3.17直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 146 期论文研讨会将由南京大学博士生胡紫灿主持，并邀请到南京大学博士生刘金梅以及南京大学硕士生吴文浩和李昊儒为大家...

赞

评论

浏览 596

论文研讨
米祈睿中科院自动化研究所2021级直博生~

发布于2026-02-06 12:18:00

🚀 从“推演”到“本能”：ProcMEM 开启 LLM Agent 经验沉淀新范式
在追求长程自主智能的道路上，如何让 Agent 真正“学以致用”？中科院自动化所、布里斯托大学、北京大学、伦敦大学学院（UCL）等团队联合发布的 ProcMEM 框架，通过构建程序记忆（Procedural Memory），实现了 Agent 性能与效率...

赞 3

评论

浏览 642

论文研讨
C

C castor_v_pollux 这家伙很懒，什么都没留下

发布于2026-02-02 12:10:35

RLChina 论文研讨会第144期（2026.2.3直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 144 期论文研讨会将由北京大学博士生鲁云龙主持，北京大学硕士生杨雄辉为大家分享最新的研究工作，欢迎大家参与。互动...

赞

评论

浏览 390

论文研讨
K

K Kaizhe Hu 这家伙很懒，什么都没留下

发布于2026-01-12 19:44:19

RLChina 论文研讨会第142期（2026.01.13直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 142 期论文研讨会将由清华大学交叉信息研究院博士生胡开哲主持，清华大学交叉信息研究院硕士生袁承博和上海期智研...

赞

评论

浏览 565

论文研讨
YanSong 这家伙很懒，什么都没留下

发布于2026-01-05 11:17:55

RLChina 论文研讨会第141期（2026.01.06直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 141 期论文研讨会将由伦敦大学学院博士生宋研主持，香港科技大学（广州）博士生刘安杰、广东工业大学与布里斯托大学联...

赞

评论

浏览 769

论文研讨
Jack Roy 这家伙很懒，什么都没留下

发布于2025-12-29 22:50:30

[2024 ICML spotlight] 调度式多任务训练 Scheduled Multi-Task Training
What 多任务强化学习 MTRL，任务复杂性的异质性影响传统 MTRL 训练（任务难度 varying）通俗的理解就是，难易程度差别很大的任务一起学 vs 难易程度相近的任务一起学，对训练有什么影响。 Why 现状：often leading to n...

赞

评论

浏览 453

论文研讨
KRHKK 这家伙很懒，什么都没留下

发布于2025-12-28 17:10:47

RLChina 论文研讨会第140期（2025.12.30直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 140 期论文研讨会将由中科院自动化研究所博士生崔新宇主持，中国科学技术大学博士生谭泽霖和北京理工大学博士生 ...

赞

评论

浏览 614

论文研讨
Z

Z Zhengbang Zhu 这家伙很懒，什么都没留下

发布于2025-12-14 15:31:48

RLChina 论文研讨会第139期（2025.12.16直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 139 期论文研讨会将由上海交通大学博士生竺正邦主持，西安电子科技大学本科生苏悦和上海交通大学博士生杨滢轩为大家分享...

赞

评论

浏览 549

论文研讨

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132