RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • H
    H harry 这家伙很懒,什么都没留下
    发布于2天前

    RLChina 论文研讨会第115期(2025.5.13直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 115 期论文研讨会将由中国科学技术大学博士生宋昊霖主持, 中国科学技术大学博士生耿子介、王泓为大家分享最新的研究工...
    赞
    评论
    浏览 54
    论文研讨
  • 刘
    刘 刘金毅 这家伙很懒,什么都没留下
    发布于19天前

    RLChina 论文研讨会第114期(2025.4.29直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 114 期论文研讨会将由天津大学博士生刘金毅主持,天津大学博士生刘金毅、天津大学硕士生程荣、天津大学硕士生崔海勤为大...
    赞 1
    评论
    浏览 215
    论文研讨
  • Criswim
    Criswim Criswim 这家伙很懒,什么都没留下
    发布于25天前

    RLChina 论文研讨会第113期(2025.04.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 114 期论文研讨会将由清华大学自动化系博士生毛逸休主持,清华大学自动化系博士生曲云为大家分享最新的研究工作,欢迎大...
    赞 1
    评论
    浏览 237
    论文研讨
  • C
    C castor_v_pollux 这家伙很懒,什么都没留下
    发布于2025-03-31 02:46:47

    RLChina 论文研讨会第112期(2025.4.1直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 112 期论文研讨会将由北京大学博士生鲁云龙主持,北京大学博士生袁昊琦和北京大学本科生黄子烨为大家分享最新的研究工作...
    赞
    评论 1
    浏览 280
    论文研讨
  • 薛
    薛 薛正海-NTU 这家伙很懒,什么都没留下
    发布于2025-03-17 10:57:53

    RLChina 论文研讨会第110期 (2025.3.18直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 110 期论文研讨会将由新加坡南洋理工大学博士生李晔文和薛正海为大家分享最新的研究工作,欢迎大家参与。 互动方式:在...
    赞
    评论 1
    浏览 371
    论文研讨
  • 汤
    汤 汤楠-NJU 这家伙很懒,什么都没留下
    发布于2025-03-18 11:28:48

    RLChina 论文研讨会第111期 (2025.3.25直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 111 期论文研讨会将由南京大学博士生汤楠主持,南京大学博士生王鹏远、南京大学博士生林浩鑫和南京大学博士生汤楠为大家...
    赞 1
    评论
    浏览 274
    论文研讨
  • 自动化所姜纪文
    自动化所姜纪文 自动化所姜纪文 (ง •_•)ง
    发布于2023-10-11 15:27:42

    一文七问 | 论文分享:大规模多智能体系统的分层均值场深度强化学习

    @toc 导读 本篇推文将为大家介绍中山大学余超老师于 2023 AAAI 发表的一篇论文: Hierarchical Mean-Field Deep Reinforcement Learning for Large-Scale Multiagent Sy...
    赞 5
    评论 8
    浏览 2166
    论文研讨
  • Z
    Z zhengrong 这家伙很懒,什么都没留下
    发布于2025-01-20 11:45:05

    RLChina 论文研讨会第109期 (2025.1.21直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 109 期论文研讨会将由清华大学薛峥嵘主持,斯坦福大学黄苏宁、卡内基梅隆大学张远航为大家分享最新的研究工作,欢迎大家参与。 互动方式...
    赞
    评论
    浏览 382
    论文研讨
  • YanSong
    YanSong YanSong 这家伙很懒,什么都没留下
    发布于2025-01-12 18:17:54

    RLChina 论文研讨会第108期(2024.01.14直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 108 期论文研讨会将由伦敦大学学院博士生宋研主持,天工 Skywork 研究科学家王超杰、吉林大学博士生郭思源,为...
    赞
    评论
    浏览 417
    论文研讨
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2025-01-10 10:22:00

    RNN策略训练稳定性提升秘籍:给RNN设置单独的学习率

    在实际的决策任务中,信息常常是受限的,我们常常只能基于局部的信息进行决策或控制。例如在机器人操控的场景下,机器人只能观测到摄像头视角内的物体。现有的研究工作通常会结合历史的观测来补齐缺失的信息。循环强化学习(recurrent RL)使用循环神经网络来对历...
    赞
    评论
    浏览 347
    论文研讨
  • 吕尧Tobias
    吕尧Tobias 吕尧Tobias 这家伙很懒,什么都没留下
    发布于2025-01-07 11:33:15

    清华团队提出RL专用神经网络优化方法RAD,创造性能新SOTA

    在人工智能领域,强化学习(RL)一直被视为解决复杂序列决策问题的有力工具。这项技术不仅在电子游戏、棋类智能、机器人控制、自动驾驶等前沿领域大放异彩,还在大语言模型(LLM)的微调、对齐、推理等关键阶段发挥着重要作用。 然而,RL 的训练过程常常表现出显著的...
    赞 2
    评论
    浏览 519
    论文研讨
  • KRHKK
    KRHKK KRHKK 这家伙很懒,什么都没留下
    发布于2025-01-02 14:02:11

    RLChina 论文研讨会第107期(2025.1.7直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 107 期论文研讨会将由中科院自动化所博士生崔新宇主持,中科院自动化所硕士生 赵祉瑜,清华大学硕士生 王以诺 和 浙...
    赞
    评论
    浏览 344
    论文研讨
  • Z
    Z Zhengbang Zhu 这家伙很懒,什么都没留下
    发布于2024-12-30 14:49:29

    RLChina 论文研讨会第106期(2024.12.31直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 106 期论文研讨会将由上海交通大学博士生竺正邦主持,清华大学博士生李兴航和新加坡国立大学博士生高崇凯为大家分享最新...
    赞
    评论
    浏览 338
    论文研讨
  • N
    N NIFEI 这家伙很懒,什么都没留下
    发布于2024-12-23 11:17:45

    RLChina 论文研讨会第105期(2024.12.24直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 105 期论文研讨会将由天津大学博士生倪飞主持,天津大学博士生袁逸夫、天津大学硕士生董子斌和天津大学硕士生寇龙馨为大...
    赞
    评论
    浏览 437
    论文研讨
  • kevinliu
    kevinliu kevinliu 这家伙很懒,什么都没留下
    发布于2024-12-18 11:23:24

    清华团队提出RL专用神经网络优化器,性能位居榜首

    在人工智能领域,强化学习(RL)一直被视为解决复杂序列决策问题的有力工具。这项技术不仅在电子游戏、棋类智能、机器人控制、自动驾驶等前沿领域大放异彩,还在大语言模型(LLM)的微调、对齐、推理等关键阶段发挥着重要作用。 然而,在深度神经网络作为函数近似器的背...
    赞 4
    评论
    浏览 662
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2024-12-16 10:50:19

    圆桌论道 | Neurips 2024 大语言模型相关 1022 篇和强化学习相关 322 篇论文整理

    圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 神经信息处理系统会议(Neural Information Processing Systems,简称 NeurIPS)是人工智能与机器学习领域最具影...
    赞 6
    评论
    浏览 3137
    论文研讨
  • Z
    Z zuwq_shanghaitech 这家伙很懒,什么都没留下
    发布于2024-12-11 16:39:22

    RLChina 论文研讨会第104期(2024.12.17直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 104 期论文研讨会将由上海科技大学硕士生祖伟钦主持,上海科技大学博士生丁枢桐、香港大学博士生胡梦康、 深圳大学大四...
    赞
    评论
    浏览 401
    论文研讨
  • C
    C castor_v_pollux 这家伙很懒,什么都没留下
    发布于2024-11-24 16:22:32

    RLChina 论文研讨会第101期(2024.11.26直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 101 期论文研讨会将由北京大学博士生鲁云龙主持,北京大学博士生段志健和北京大学博士生陈炤桦为大家分享最新的研究工作...
    赞
    评论
    浏览 336
    论文研讨
  • O
    O Og 这家伙很懒,什么都没留下
    发布于2024-11-13 14:38:57
    同样一个使用rl_zoo3训练的模型,使用stablebaseline3的evaluate_policy和rl_zoo3的rl_zoo3.enjoy.enjoy测试出来的score为什么会差别很大哇 from stable_baselines3.common.evaluation import evaluate_policy model = sb3.PPO.load(model_path, env=env, print_system_info=True) mean_reward, std_reward = evaluate_policy(model, model.get_env(), n_eval_episodes=4)
    赞
    评论
    浏览 243
    论文研讨
  • 庞竟成
    庞竟成 庞竟成 南京大学
    发布于2024-09-21 16:29:24

    RLChina 论文研讨会第100期(2024.9.24直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 100 期论文讨论会将由南京大学博士生庞竟成同学主持,东京大学博士生 Johannes Ackermann、南洋理工...
    赞 1
    评论
    浏览 803
    论文研讨
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    894
  • R
    Rlxia

    0 帖子 • 0 评论

    563
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链