新闻动态 - 话题 | RLChina 强化学习社区

赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2024-07-11 00:59:03

前沿追踪 | 强化学习月度十大动态 2406 期：佐治亚理工学院研究语言引导技能发现，通过GUI控制的DigiRL等
导读本推文整理了 2024 年 6 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 2

评论 1

浏览 1553

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-08-09 22:35:03

前沿追踪 | 强化学习月度十大动态 2307 期：DeepMind使用大模型构建通用智能体，RT-2发布等
导读本推文整理了 2023 年 7 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论 1

浏览 1889

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-12-10 16:38:03

前沿追踪 | 强化学习月度十大动态 2211 期：Meta提出AI外交模型，ChatGPT免费开放等
导读本推文整理了 2022 年 11 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，...

赞 2

评论

浏览 1684

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-09-13 01:28:36

前沿追踪 | 强化学习月度十大动态 2308 期：利用强化学习构建语言智能体，微软通过RLEIF提高LLM数学能力等
导读本推文整理了 2023 年 8 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 1792

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-07-12 10:37:36

前沿追踪 | 强化学习月度十大动态 2306 期：UCB利用语言提升智能体决策能力，DeepMind提出RoboCat等
导读本推文整理了 2023 年 6 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 1261

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-06-09 00:11:38

前沿追踪 | 强化学习月度十大动态 2305 期：英伟达将大模型应用于我的世界，Meta使用自监督学习算法实现通用序列决策框架等
导读本推文整理了 2023 年 5 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1866

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-05-07 22:59:59

前沿追踪 | 强化学习月度十大动态 2304 期：斯坦福大学与谷歌构建AI小镇，牛津大学开源PureJaxRL等
导读本推文整理了 2023 年 4 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 2

评论

浏览 1473

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-04-08 22:46:30

前沿追踪 | 强化学习月度十大动态 2303 期：清华大学与密歇根大学发表《自然》封面文章，谷歌机器人团队利用语言模型控制机器人等
导读本推文整理了 2023 年 3 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1778

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-03-10 22:43:14

前沿追踪 | 强化学习月度十大动态 2302 期：微软使用ChatGPT控制机器人，加州大学伯克利分校利用大语言模型指导探索等
导读本推文整理了 2023 年 2 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1772

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-02-08 10:16:10

前沿追踪 | 强化学习月度十大动态 2301 期：基于世界模型的通用算法，通过文本-图像生成学习通用策略等
导读本推文整理了 2023 年 1 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 2095

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2023-01-09 18:25:42

前沿追踪 | 强化学习月度十大动态 2212 期：谷歌开源机器人领域transformer，西洋双陆棋智能体登上Science等
导读本推文整理了 2022 年 12 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，...

赞

评论

浏览 1483

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-02-08 15:05:18

前沿追踪 | 强化学习月度十大动态 2201 期：可解释性强化学习综述，多任务学习理论分析等
导读本推文整理了 2022 年 1 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、竞赛等内容，全面覆盖 RL theory，multi-agent RL，unsupervised RL，offline RL，RL application...

赞 2

评论

浏览 2384

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-11-06 22:09:22

前沿追踪 | 强化学习月度十大动态 2210 期：DeepMind发现快速矩阵乘法算法，加州伯克利分校训练四足机器人守门员等
导读本推文整理了 2022 年 10 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，...

赞

评论

浏览 1292

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-10-15 10:50:01

前沿追踪 | 强化学习月度十大动态 2209 期：斯坦福大学提出社会人工智能，DeepMind构建安全对话智能体Sparrow等
导读本推文整理了 2022 年 9 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1548

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-09-13 14:24:36

前沿追踪 | 强化学习月度十大动态 2208 期：普渡大学利用RL进行蛋白质拼接，牛津大学提出强化学习任务自动机等
导读本推文整理了 2022 年 8 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1537

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-08-05 20:55:04

前沿追踪 | 强化学习月度十大动态 2207 期：芝加哥大学提出对比UCB算法，华为将离线学习应用于混合整数规划问题等
导读本推文整理了 2022 年 7 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1662

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-07-07 10:21:07

前沿追踪 | 强化学习月度十大动态 2206 期：RL攻克Stratego，伯克利研究可交互编队学习方法等
导读本推文整理了 2022 年 6 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 2

评论

浏览 1598

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-06-12 00:15:30

前沿追踪 | 强化学习月度十大动态 2205 期：通用AI智能体Gato，上海数字大脑研究院等研究使用序列模型求解MARL等
导读本推文整理了 2022 年 5 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 1841

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-05-06 16:18:26

前沿追踪 | 强化学习月度十大动态 2204 期：谷歌研究RL初始化问题，CMU与DEE将离线蒸馏技术应用在机器人终身学习等
导读本推文整理了 2022 年 4 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1700

新闻动态
赵祉瑜+中科院自动化所本科北京理工大学，中科院自动化所硕士

发布于2022-04-06 10:20:29

前沿追踪 | 强化学习月度十大动态 2203 期：谷歌使用自然语言指导机器人行动，DeepMind发布AlphaCode系统等
导读本推文整理了 2022 年 3 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞

评论

浏览 1901

新闻动态

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132