RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • Heron_7
    Heron_7 Heron_7 这家伙很懒,什么都没留下
    发布于2025-04-01 20:11:32

    零编程基础入门RL求助(请教各位大佬

    各位大佬好,我是三年级在读电子信息工程专业本科生,由于之前没有想过转码也没有什么编程方面的课程,现在的代码功底比较差。但是 Py 的基础语法我都学过一遍,但是感觉写的都不是很精。尤其是类和对象那一块,在看张伟楠老师的动手学 RL 那本书的时候发现自己可以懂...
    赞
    评论 8
    浏览 308
    课程学习
  • 南荣遥羿
    南荣遥羿 南荣遥羿 几乎是废学忘习地寝食。
    发布于2024-09-05 13:53:56

    入门强化学习的小白求助

    各位前辈们好,我目前本科软件工程二年级在读,在自学 CS285 等相关课程,有些吃力。想问问前辈们有无深度强化学习的入门经验或者学习路线的分享?! 或者近期有哪些很不错的方向值得关注和研究! 欢迎批评和指导,谢谢大家。
    赞
    评论 5
    浏览 1492
    课程学习
  • R
    R rlrookie 这家伙很懒,什么都没留下
    发布于2024-11-09 11:00:16

    入门多智能体博弈的小白求教

    本人研 0,想问问有什么好的课程或者方法来入门多智能体博弈 qwq
    赞 2
    评论 2
    浏览 408
    课程学习
  • X
    X xlq 这家伙很懒,什么都没留下
    发布于2024-10-21 19:55:11

    有关PPO里面的重要性采样权重的疑问?

    为什么我看网上大多数代码再计算重要性采样权重的时候用的是(新策略-旧策略)的 e 指数来计算的,但是书上和资料上不都是直接相除的吗?但是我改成相除发现效果又很差,有没有大佬知道为什么要取指数?
    赞
    评论 4
    浏览 450
    课程学习
  • haokwao
    haokwao haokwao 这家伙很懒,什么都没留下
    发布于2024-02-23 19:57:52

    多智能体强化学习环境的选择——SMAC和Unity ml-agents哪个好?

    导师组开新方向,就我一个人,目前已经研二下,请问 SMAC 和 ml-agents 哪个作为 RL 的环境比较好?主要目的是想尽快出成果。 目前存在几个情况: 1.实验室硬件条件不足,本人目前是通过租用 autodl 来训练的,租用的服务器没有图形化界面,...
    赞
    评论
    浏览 1046
    课程学习
  • 栗
    栗 栗子 这家伙很懒,什么都没留下
    发布于2024-02-13 19:25:34

    运筹学与博弈论

    求各位大佬 有没有会此类的,孩子学不会了、有偿有偿,感谢大家 感兴趣的 + 我 Sixpence_JC
    赞
    评论 1
    浏览 561
    课程学习
  • 小
    小 小白一枚 这家伙很懒,什么都没留下
    发布于2023-11-10 11:42:27

    求助!!!

    强化学习中动作会导致奖励的变化,不会引起状态的变化,这种情况是否可行
    赞
    评论 2
    浏览 720
    课程学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2023-03-09 18:05:19

    话题讨论:ChatGPT后的通用人工智能理论和应用

    时间 3 月 17 日 周五 下午 8:00-9:00 直播观看 http://live.bilibili.com/22386217 提问互动 本帖下方评论区 嘉宾介绍 汪军 伦敦大学学院 (UCL) 教授,上海数字大脑研究院联合创始人、院长 个人简介:...
    赞
    评论 17
    浏览 1328
    课程学习
  • Haitham Bou Ammar
    Haitham Bou Ammar Haitham Bou Ammar RL team leader @Huawei R&D UK & UCL H. Assistant Prof.
    发布于2022-03-02 22:47:19

    Iterated Law of Expectation Consice Proof (6 simple steps)

    When deriving the Belman equations, we needed the iterated law of expectations. Rather than believing me, have a look at this 6-...
    赞 3
    评论 1
    浏览 1366
    课程学习
  • Haitham Bou Ammar
    Haitham Bou Ammar Haitham Bou Ammar RL team leader @Huawei R&D UK & UCL H. Assistant Prof.
    发布于2022-03-07 02:52:21
    A 4 step proof that value baselines don't affect policy grads in #RL😀Just the log-trick & Fubini gets u there!
    赞 8
    评论 4
    浏览 1721
    课程学习
  • 白辰甲(TeleAI)
    白辰甲(TeleAI) 白辰甲(TeleAI) 强化学习
    发布于2023-06-08 22:50:11

    新书推荐 |《强化学习:前沿算法与应用》

    《强化学习:前沿算法与应用》新书出版! 由上海人工智能实验室白辰甲博士,哈工大赵英男博士,天津大学教授郝建业博士等联合编写的强化学习专著《强化学习:前沿算法与应用》由机械工业出版社出版发行,官方地址 https://item.jd.com/10077221...
    赞 1
    评论
    浏览 1666
    课程学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2023-03-05 13:35:25

    RLChina 2023 ChatGPT 和大模型春季课程

    导读 RLChina 邀请了全球相关领域知名专家和学者举办 ChatGPT 和大模型春季课程,深入讲解 ChatGPT 和大模型的原理和实践,从不同的角度探讨“ChatGPT 以后的通用人工智能理论和应用”。课程为期一周,分为实践课、专题报告、话题讨论三个...
    赞 5
    评论 2
    浏览 6111
    课程学习
  • 寒
    寒 寒涵 这家伙很懒,什么都没留下
    发布于2023-04-22 04:25:58

    新书推荐 | Reinforcement learning for sequential decision and optimal control

    购买链接:链接 引言:人工智能的飞速发展正在重塑人类社会的诸多领域,强化学习(Reinforcement Learning,RL)作为最重要一项核心技术,正引起了学术界和工业界的广泛关注。强化学习的成功应用,如 AlphaGo, ChatGPT 等,已经证...
    赞
    评论
    浏览 1079
    课程学习
  • 张伟楠
    张伟楠 张伟楠 上海交通大学副教授,研究强化学习、数据科学。
    发布于2022-05-18 17:35:22

    上海交通大学强化学习课件

    大家好,我是张伟楠,近期将自己在上海交大 ACM 班和 AI 班讲授的《强化学习》课程的课件公布在了: https://hrl.boyuai.com/slides/ 我第一时间在咱 RLChina 社区吼一声,欢迎各位同学们来看看课件,看看课程视频,顺便《...
    赞 28
    评论 11
    浏览 4555
    课程学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2023-03-09 17:34:22

    专题报告七:负责任的AI:智能体的道德指导

    时间 3 月 17 日 周五 下午 7:00-8:00 直播观看 http://live.bilibili.com/22386217 提问互动 本帖下方评论区 讲师介绍 方蒙 利物浦大学 助理教授(博导) 个人简介: 方蒙博士,英国利物浦大学助理教授(博...
    赞
    评论 8
    浏览 1128
    课程学习
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-17 14:43:50

    ChatGPT和大模型春季课程Day5:大咖齐聚,探讨ChatGPT后的通用人工智能理论和应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为实践课、专题报告和话题讨论三个部分。 ChatGPT 的走红再次...
    赞
    评论
    浏览 724
    课程学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2023-03-09 17:32:02

    专题报告六:基于大语言模型的开放世界智能决策

    时间 3 月 16 日 周四 下午 8:00-9:00 直播观看 http://live.bilibili.com/22386217 提问互动 本帖下方评论区 讲师介绍 杨耀东 北京大学人工智能研究院 助理教授(博导) 个人简介: 杨耀东博士,北京大学人...
    赞 1
    评论 7
    浏览 1188
    课程学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2023-03-09 17:29:58

    专题报告五:ChatGPT,用聊天将人类与语言模型联系起来

    时间 3 月 16 日 周四 下午 7:00-8:00 直播观看 http://live.bilibili.com/22386217 提问互动 本帖下方评论区 讲师介绍 王本友 香港中文大学(深圳) 教授 个人简介: 王本友是香港中文大学数据科学学院助理...
    赞
    评论 4
    浏览 968
    课程学习
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-16 15:51:21

    ChatGPT和大模型春季课程Day4:港中文(深圳)助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为专题报告、实践课和话题讨论三个部分。 今天【ChatGPT 和大...
    赞
    评论 5
    浏览 1147
    课程学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2023-03-09 17:28:50

    专题报告四:预训练,指令微调,对齐,专业化:论大语言模型能力的来源

    时间 3 月 15 日 周三 下午 8:00-9:00 直播观看 http://live.bilibili.com/22386217 提问互动 本帖下方评论区 讲师介绍 符尧 爱丁堡大学 博士生,艾伦人工智能研究所学生研究员 个人简介: 符尧是爱丁堡大学...
    赞
    评论 9
    浏览 1194
    课程学习
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    894
  • R
    Rlxia

    0 帖子 • 0 评论

    563
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链