新闻动态 - 话题 | RLChina 强化学习社区

赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-07-11 00:59:03

前沿追踪 | 强化学习月度十大动态 2406 期：佐治亚理工学院研究语言引导技能发现，通过GUI控制的DigiRL等
导读本推文整理了 2024 年 6 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 2

评论 1

浏览 1552

新闻动态
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业，核心技术是通过推演亿万种决策的不同结果，找到通向未来的最优路径，实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启，开创性地提出数据驱动的虚拟环境构建技术，从少量历史交互数据中构建虚拟世界，寻找最优决策，避免在线试错的代价。

发布于2024-11-25 11:13:17

南栖仙策&南京大学联合提出更强泛化的大规模世界模型以辅助具身智能决策
世界模型在具身智能决策中扮演着关键角色。为了实现高效决策，世界模型必须具备强大的泛化能力，同时提供可靠的不确定性估计。基于此，南京大学与南栖仙策团队提出了一种通用的世界模型构建范式 WHALE，通过引入行为条件化机制和回溯推演技术，提升了世界模型的分布外泛...

赞

评论

浏览 1099

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-06-10 20:14:54

前沿追踪 | 强化学习月度十大动态 2405 期：伊利诺伊大学研究在线迭代RLHF方法，生成药物设计量身定制的综合性工具包ACEGEN等
导读本推文整理了 2024 年 5 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 1262

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-05-11 01:16:07

前沿追踪 | 强化学习月度十大动态 2404 期：Llama 3发布，牛津大学研究可控合成训练数据等
导读本推文整理了 2024 年 4 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 3314

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-04-10 20:51:54

前沿追踪 | 强化学习月度十大动态 2403 期：使用语音控制的YAY Robot，LLM玩荒野大镖客
导读本推文整理了 2024 年 3 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1372

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-03-11 10:49:29

前沿追踪 | 强化学习月度十大动态 2402 期：Sora，Genie发布
导读本推文整理了 2024 年 2 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1162

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-02-10 22:22:44

前沿追踪 | 强化学习月度十大动态 2401 期：李飞飞、吴恩达开年对话，家务机器人Mobile ALOHA等
导读本推文整理了 2024 年 1 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 6112

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-01-10 22:27:12

前沿追踪 | 强化学习月度十大动态 2312 期：Jeff Dean发表2023年度总结，中科院验证LLM在星际争霸 II上的能力等
导读本推文整理了 2023 年 12 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，...

赞 2

评论 2

浏览 1415

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-12-10 13:30:34

前沿追踪 | 强化学习月度十大动态 2311 期：罗格斯大学与密歇根大学提出WarAgent，微软将GPT-4V应用于机器人
导读本推文整理了 2023 年 11 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，...

赞

评论

浏览 1412

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-11-10 00:41:41

前沿追踪 | 强化学习月度十大动态 2310 期：斯坦福大学发布具身人工智能基准测试，加州大学伯克利分校提出基础强化学习等
导读本推文整理了 2023 年 10 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，...

赞 2

评论

浏览 1589

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-10-11 00:45:52

前沿追踪 | 强化学习月度十大动态 2309 期：MindAgent，Q-Transformer等
导读本推文整理了 2023 年 9 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1837

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-09-13 01:28:36

前沿追踪 | 强化学习月度十大动态 2308 期：利用强化学习构建语言智能体，微软通过RLEIF提高LLM数学能力等
导读本推文整理了 2023 年 8 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 1791

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-08-09 22:35:03

前沿追踪 | 强化学习月度十大动态 2307 期：DeepMind使用大模型构建通用智能体，RT-2发布等
导读本推文整理了 2023 年 7 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论 1

浏览 1888

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-07-12 10:37:36

前沿追踪 | 强化学习月度十大动态 2306 期：UCB利用语言提升智能体决策能力，DeepMind提出RoboCat等
导读本推文整理了 2023 年 6 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 1260

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-06-09 00:11:38

前沿追踪 | 强化学习月度十大动态 2305 期：英伟达将大模型应用于我的世界，Meta使用自监督学习算法实现通用序列决策框架等
导读本推文整理了 2023 年 5 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1865

新闻动态
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2021-10-24 18:00:38

RLChina 组织形式
RLChina 目前由学术委员会、编辑部、校园学习小组 3 个部分构成，分别起到学术引领、信息发布、学习交流的作用。 RLChina 学术委员会 RLChina 学术委员会于 2021 年 10 月 22 日成立，将致力于促进决策智能领域的“产学研”发展。...

赞 21

评论 2

浏览 9587

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-05-07 22:59:59

前沿追踪 | 强化学习月度十大动态 2304 期：斯坦福大学与谷歌构建AI小镇，牛津大学开源PureJaxRL等
导读本推文整理了 2023 年 4 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 2

评论

浏览 1472

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-04-08 22:46:30

前沿追踪 | 强化学习月度十大动态 2303 期：清华大学与密歇根大学发表《自然》封面文章，谷歌机器人团队利用语言模型控制机器人等
导读本推文整理了 2023 年 3 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1777

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-03-10 22:43:14

前沿追踪 | 强化学习月度十大动态 2302 期：微软使用ChatGPT控制机器人，加州大学伯克利分校利用大语言模型指导探索等
导读本推文整理了 2023 年 2 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1771

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-02-08 10:16:10

前沿追踪 | 强化学习月度十大动态 2301 期：基于世界模型的通用算法，通过文本-图像生成学习通用策略等
导读本推文整理了 2023 年 1 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 2094

新闻动态

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132