RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2024-11-25 11:13:17

    南栖仙策&南京大学联合提出更强泛化的大规模世界模型以辅助具身智能决策

    世界模型在具身智能决策中扮演着关键角色。为了实现高效决策,世界模型必须具备强大的泛化能力,同时提供可靠的不确定性估计。基于此,南京大学与南栖仙策团队提出了一种通用的世界模型构建范式 WHALE,通过引入行为条件化机制和回溯推演技术,提升了世界模型的分布外泛...
    赞
    评论
    浏览 459
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-07-11 00:59:03

    前沿追踪 | 强化学习月度十大动态 2406 期:佐治亚理工学院研究语言引导技能发现,通过GUI控制的DigiRL等

    导读 本推文整理了 2024 年 6 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论
    浏览 844
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-06-10 20:14:54

    前沿追踪 | 强化学习月度十大动态 2405 期:伊利诺伊大学研究在线迭代RLHF方法,生成药物设计量身定制的综合性工具包ACEGEN等

    导读 本推文整理了 2024 年 5 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论
    浏览 697
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-05-11 01:16:07

    前沿追踪 | 强化学习月度十大动态 2404 期:Llama 3发布,牛津大学研究可控合成训练数据等

    导读 本推文整理了 2024 年 4 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 2525
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-04-10 20:51:54

    前沿追踪 | 强化学习月度十大动态 2403 期:使用语音控制的YAY Robot,LLM玩荒野大镖客

    导读 本推文整理了 2024 年 3 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 776
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-03-11 10:49:29

    前沿追踪 | 强化学习月度十大动态 2402 期:Sora,Genie发布

    导读 本推文整理了 2024 年 2 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 665
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-02-10 22:22:44

    前沿追踪 | 强化学习月度十大动态 2401 期:李飞飞、吴恩达开年对话,家务机器人Mobile ALOHA等

    导读 本推文整理了 2024 年 1 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 4715
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-01-10 22:27:12

    前沿追踪 | 强化学习月度十大动态 2312 期:Jeff Dean发表2023年度总结,中科院验证LLM在星际争霸 II上的能力等

    导读 本推文整理了 2023 年 12 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,...
    赞 2
    评论 2
    浏览 901
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-12-10 13:30:34

    前沿追踪 | 强化学习月度十大动态 2311 期:罗格斯大学与密歇根大学提出WarAgent,微软将GPT-4V应用于机器人

    导读 本推文整理了 2023 年 11 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,...
    赞
    评论
    浏览 825
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-11-10 00:41:41

    前沿追踪 | 强化学习月度十大动态 2310 期:斯坦福大学发布具身人工智能基准测试,加州大学伯克利分校提出基础强化学习等

    导读 本推文整理了 2023 年 10 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,...
    赞 2
    评论
    浏览 1019
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-10-11 00:45:52

    前沿追踪 | 强化学习月度十大动态 2309 期:MindAgent,Q-Transformer等

    导读 本推文整理了 2023 年 9 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 1192
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-09-13 01:28:36

    前沿追踪 | 强化学习月度十大动态 2308 期:利用强化学习构建语言智能体,微软通过RLEIF提高LLM数学能力等

    导读 本推文整理了 2023 年 8 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论
    浏览 1227
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-08-09 22:35:03

    前沿追踪 | 强化学习月度十大动态 2307 期:DeepMind使用大模型构建通用智能体,RT-2发布等

    导读 本推文整理了 2023 年 7 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论 1
    浏览 1103
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-07-12 10:37:36

    前沿追踪 | 强化学习月度十大动态 2306 期:UCB利用语言提升智能体决策能力,DeepMind提出RoboCat等

    导读 本推文整理了 2023 年 6 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论
    浏览 786
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-06-09 00:11:38

    前沿追踪 | 强化学习月度十大动态 2305 期:英伟达将大模型应用于我的世界,Meta使用自监督学习算法实现通用序列决策框架等

    导读 本推文整理了 2023 年 5 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 1187
    新闻动态
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2021-10-24 18:00:38

    RLChina 组织形式

    RLChina 目前由学术委员会、编辑部、校园学习小组 3 个部分构成,分别起到学术引领、信息发布、学习交流的作用。 RLChina 学术委员会 RLChina 学术委员会于 2021 年 10 月 22 日成立,将致力于促进决策智能领域的“产学研”发展。...
    赞 21
    评论 2
    浏览 7530
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-05-07 22:59:59

    前沿追踪 | 强化学习月度十大动态 2304 期:斯坦福大学与谷歌构建AI小镇,牛津大学开源PureJaxRL等

    导读 本推文整理了 2023 年 4 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 2
    评论
    浏览 939
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-04-08 22:46:30

    前沿追踪 | 强化学习月度十大动态 2303 期:清华大学与密歇根大学发表《自然》封面文章,谷歌机器人团队利用语言模型控制机器人等

    导读 本推文整理了 2023 年 3 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 1238
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-03-10 22:43:14

    前沿追踪 | 强化学习月度十大动态 2302 期:微软使用ChatGPT控制机器人,加州大学伯克利分校利用大语言模型指导探索等

    导读 本推文整理了 2023 年 2 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 1229
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-02-08 10:16:10

    前沿追踪 | 强化学习月度十大动态 2301 期:基于世界模型的通用算法,通过文本-图像生成学习通用策略等

    导读 本推文整理了 2023 年 1 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 1402
    新闻动态
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    895
  • R
    Rlxia

    0 帖子 • 0 评论

    564
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链