课程学习 - 话题 | RLChina 强化学习社区

pan95732 pan95732

发布于2026-01-13 09:16:49

金融学，会计，社会学，经济学........
金融学，会计，社会学，经济学........ 岗位要求： 1、英语有较好的阅读能力，四六级或雅思 6.5+ 或托福 90+； 2、985/211 院校本科大三以上，研究生、硕士等；（国内外应往届均可）； 3、做事一定要认真负责有耐心，工作时间地点不限； V...

赞 1

评论 10

浏览 626

课程学习
pan95732 pan95732

发布于2025-08-21 16:31:40

前端、web、可视化、C#…
前端、Web、可视化、C#… 岗位要求： 1、英语有较好的阅读能力，四六级或雅思 6.5+ 或托福 90+； 2、985/211 院校本科大三以上，研究生、硕士等；（国内外应往届均可）； 3、做事一定要认真负责有耐心，工作时间地点不限； V:pan9573...

赞 1

评论 18

浏览 1002

课程学习
Heron_7 这家伙很懒，什么都没留下

发布于2025-04-01 20:11:32

零编程基础入门RL求助（请教各位大佬
各位大佬好，我是三年级在读电子信息工程专业本科生，由于之前没有想过转码也没有什么编程方面的课程，现在的代码功底比较差。但是 Py 的基础语法我都学过一遍，但是感觉写的都不是很精。尤其是类和对象那一块，在看张伟楠老师的动手学 RL 那本书的时候发现自己可以懂...

赞

评论 19

浏览 1719

课程学习
南荣遥羿几乎是废学忘习地寝食。

发布于2024-09-05 13:53:56

入门强化学习的小白求助
各位前辈们好，我目前本科软件工程二年级在读，在自学 CS285 等相关课程，有些吃力。想问问前辈们有无深度强化学习的入门经验或者学习路线的分享？！或者近期有哪些很不错的方向值得关注和研究！欢迎批评和指导，谢谢大家。

赞

评论 5

浏览 2258

课程学习
R

R rlrookie 这家伙很懒，什么都没留下

发布于2024-11-09 11:00:16

入门多智能体博弈的小白求教
本人研 0，想问问有什么好的课程或者方法来入门多智能体博弈 qwq

赞 2

评论 2

浏览 966

课程学习
X

X xlq 这家伙很懒，什么都没留下

发布于2024-10-21 19:55:11

有关PPO里面的重要性采样权重的疑问？
为什么我看网上大多数代码再计算重要性采样权重的时候用的是（新策略-旧策略）的 e 指数来计算的，但是书上和资料上不都是直接相除的吗？但是我改成相除发现效果又很差，有没有大佬知道为什么要取指数？

赞

评论 4

浏览 967

课程学习
haokwao 这家伙很懒，什么都没留下

发布于2024-02-23 19:57:52

多智能体强化学习环境的选择——SMAC和Unity ml-agents哪个好？
导师组开新方向，就我一个人，目前已经研二下，请问 SMAC 和 ml-agents 哪个作为 RL 的环境比较好？主要目的是想尽快出成果。目前存在几个情况： 1.实验室硬件条件不足，本人目前是通过租用 autodl 来训练的，租用的服务器没有图形化界面，...

赞

评论

浏览 1767

课程学习
栗

栗栗子这家伙很懒，什么都没留下

发布于2024-02-13 19:25:34

运筹学与博弈论
求各位大佬有没有会此类的，孩子学不会了、有偿有偿，感谢大家感兴趣的 + 我 Sixpence_JC

赞

评论 1

浏览 1067

课程学习
小

小小白一枚这家伙很懒，什么都没留下

发布于2023-11-10 11:42:27

求助！！！
强化学习中动作会导致奖励的变化，不会引起状态的变化，这种情况是否可行

赞

评论 2

浏览 1179

课程学习
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2023-03-09 18:05:19

话题讨论：ChatGPT后的通用人工智能理论和应用
时间 3 月 17 日周五下午 8：00-9：00 直播观看 http://live.bilibili.com/22386217 提问互动本帖下方评论区嘉宾介绍汪军伦敦大学学院 (UCL) 教授，上海数字大脑研究院联合创始人、院长个人简介：...

赞

评论 17

浏览 1987

课程学习
Haitham Bou Ammar RL team leader @Huawei R&D UK & UCL H. Assistant Prof.

发布于2022-03-02 22:47:19

Iterated Law of Expectation Consice Proof (6 simple steps)
When deriving the Belman equations, we needed the iterated law of expectations. Rather than believing me, have a look at this 6-...

赞 3

评论 1

浏览 1944

课程学习
Haitham Bou Ammar RL team leader @Huawei R&D UK & UCL H. Assistant Prof.

发布于2022-03-07 02:52:21
A 4 step proof that value baselines don't affect policy grads in #RL😀Just the log-trick & Fubini gets u there!
赞 9

评论 4

浏览 2337

课程学习
白辰甲（TeleAI）强化学习

发布于2023-06-08 22:50:11

新书推荐 |《强化学习：前沿算法与应用》
《强化学习：前沿算法与应用》新书出版！由上海人工智能实验室白辰甲博士，哈工大赵英男博士，天津大学教授郝建业博士等联合编写的强化学习专著《强化学习：前沿算法与应用》由机械工业出版社出版发行，官方地址 https://item.jd.com/10077221...

赞 1

评论

浏览 2740

课程学习
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2023-03-05 13:35:25

RLChina 2023 ChatGPT 和大模型春季课程
导读 RLChina 邀请了全球相关领域知名专家和学者举办 ChatGPT 和大模型春季课程，深入讲解 ChatGPT 和大模型的原理和实践，从不同的角度探讨“ChatGPT 以后的通用人工智能理论和应用”。课程为期一周，分为实践课、专题报告、话题讨论三个...

赞 5

评论 2

浏览 7102

课程学习
寒

寒寒涵这家伙很懒，什么都没留下

发布于2023-04-22 04:25:58

新书推荐 | Reinforcement learning for sequential decision and optimal control
购买链接：链接引言：人工智能的飞速发展正在重塑人类社会的诸多领域，强化学习（Reinforcement Learning，RL）作为最重要一项核心技术，正引起了学术界和工业界的广泛关注。强化学习的成功应用，如 AlphaGo, ChatGPT 等，已经证...

赞

评论

浏览 1857

课程学习
张伟楠上海交通大学副教授，研究强化学习、数据科学。

发布于2022-05-18 17:35:22

上海交通大学强化学习课件
大家好，我是张伟楠，近期将自己在上海交大 ACM 班和 AI 班讲授的《强化学习》课程的课件公布在了： https://hrl.boyuai.com/slides/ 我第一时间在咱 RLChina 社区吼一声，欢迎各位同学们来看看课件，看看课程视频，顺便《...

赞 28

评论 11

浏览 5897

课程学习
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2023-03-09 17:34:22

专题报告七：负责任的AI：智能体的道德指导
时间 3 月 17 日周五下午 7：00-8：00 直播观看 http://live.bilibili.com/22386217 提问互动本帖下方评论区讲师介绍方蒙利物浦大学助理教授（博导）个人简介：方蒙博士，英国利物浦大学助理教授（博...

赞

评论 8

浏览 1699

课程学习
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-17 14:43:50

ChatGPT和大模型春季课程Day5:大咖齐聚，探讨ChatGPT后的通用人工智能理论和应用
RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周，分为实践课、专题报告和话题讨论三个部分。 ChatGPT 的走红再次...

赞

评论

浏览 1203

课程学习
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2023-03-09 17:32:02

专题报告六：基于大语言模型的开放世界智能决策
时间 3 月 16 日周四下午 8：00-9：00 直播观看 http://live.bilibili.com/22386217 提问互动本帖下方评论区讲师介绍杨耀东北京大学人工智能研究院助理教授（博导）个人简介：杨耀东博士，北京大学人...

赞 1

评论 7

浏览 1791

课程学习
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2023-03-09 17:29:58

专题报告五：ChatGPT，用聊天将人类与语言模型联系起来
时间 3 月 16 日周四下午 7：00-8：00 直播观看 http://live.bilibili.com/22386217 提问互动本帖下方评论区讲师介绍王本友香港中文大学（深圳）教授个人简介：王本友是香港中文大学数据科学学院助理...

赞

评论 4

浏览 1502

课程学习

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132