强化学习 - 话题 | RLChina 强化学习社区

Error_666 Work hard, be nice.

发布于2024-10-07 22:39:11

TD时序差分算法的off-policy version的疑问
目前对 off-policy 的理解是，生成 experience 数据的 policy 与优化出的 policy 不同。那么如果是这样的话，与 on-policy 相比，感觉很难得到真正的最优 policy，因为它是在生成 experience 数据的...

赞

评论 2

浏览 995

水区
Willing Star 这家伙很懒，什么都没留下

发布于2024-04-22 15:56:15

通用决策模型路在何方？
有同学在研究决策通用模型吗？不知道这个发现会向那个方向发展。目前的一些思路比如传统的 meta-RL、domain adaption for RL、decision transformer 类的工作如 Gato、VLM 策略如 RT 系列，还有通用环境模型...

赞 3

评论 3

浏览 1074

水区
K

K Kenan.Guan 这家伙很懒，什么都没留下

发布于2024-04-07 17:05:17

RL模型的特征选择问题
求问大家，RL 模型一般用什么方法进行特征选择呢？选择到不好的特征会多大程度上影响 RL 模型的学习效果？我在网上看了很久，没有看到很多有关于这方面的研究。

赞

评论 2

浏览 1091

学术活动
米祈睿中科院自动化研究所2021级直博生~

发布于2024-03-24 12:58:40

圆桌论道 | ICLR 2024 强化学习和 LLM 相关573篇论文整理
圆桌论道 “圆桌论道”是 RLChina 的一个栏目，发布国内外前沿学术活动的预告、总结或解读等。导读国际学习表征会议（International Conference on Learning Representations, 简称 ICLR）是计算机...

赞 12

评论 2

浏览 15379

论文研讨
pan95732 pan95732

发布于2023-09-04 11:52:57

【兼职】专业不限，只要你本专业知识扎实即可胜任！
【介绍】我们是一家专注于为大学生群体提供课后习题答疑的教育机构，采用网络 1 对 1 的答疑形式。在这里，我们能提供不同难度的习题辅导的机会。只要您有电脑，学习成绩优秀，在空闲时解题，然后用文字 or 文档的形式给学生答疑解惑即可。【时间】我们是灵活...

赞 1

评论 2

浏览 1141

招生招聘
microyu https://github.com/gxywy

发布于2021-10-09 19:29:14

推荐强化学习绘图库rl-plotter
非常实用的强化学习绘图库，一行命令就能搞定强化学习算法的学习曲线，详见 Github 页面更新了预览图片，欢迎大家点赞本贴和 star 支持~ rl-plotter This is a simple tool which can plot lear...

赞 24

评论 21

浏览 5458

实用工具
是Megan呀认真了解RL的萌新一枚！

发布于2022-12-29 14:14:15

【量化交易公司招聘】招聘强化学习方向实习生
#正定私募招实习生 🙌 量化研究-强化学习方向工作内容研究 RL 在量化交易中的应用要求 1.国内外重点院校硕博生，至少实习 3 个月 2.有较为丰富的 RL 经验 3.掌握 Python，熟练使用各种机器学习工具 4.数学/机器学习知识扎实，有顶...

赞 2

评论 5

浏览 2019

招生招聘
米祈睿中科院自动化研究所2021级直博生~

发布于2023-06-28 23:44:12

IJCAI 2023 4篇 RL4Finance 论文整理
本人在整理 IJCAI 2023 RL 相关论文时，发现基于 RL 研究 economics、finance 问题的工作（竟然！）有 4 篇（而总体 RL 相关论文只有 66 篇），个人最近在研究计算经济学相关问题，因此自己学习的同时，将这 4 篇论文摘...

赞 6

评论 4

浏览 2492

论文研讨
米祈睿中科院自动化研究所2021级直博生~

发布于2023-06-28 23:11:55

圆桌论道 | IJCAI 2023 强化学习相关 66 篇论文分类整理
圆桌论道 “圆桌论道”是 RLChina 的一个栏目，发布国内外前沿学术活动的预告、总结或解读等。导读国际人工智能联合会议（International Joint Conference on Artificial Intelligence, 简称为 I...

赞 6

评论 3

浏览 3971

论文研讨
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-16 15:51:21

ChatGPT和大模型春季课程Day4：港中文（深圳）助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用
RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周，分为专题报告、实践课和话题讨论三个部分。今天【ChatGPT 和大...

赞

评论 5

浏览 1775

课程学习
米祈睿中科院自动化研究所2021级直博生~

发布于2021-11-27 01:48:33

圆桌论道 | NeurIPS 2021 强化学习相关 386 篇论文分类整理
导读 NeurIPS (Annual Conference on Neural Information Processing Systems)会议于 1987 年在加拿大创办，是人工智能、机器学习领域的顶级会议（CCF-A 类）。NeurIPS 2021 ...

赞 24

评论 5

浏览 7675

学术活动
帅小伙这家伙很懒，什么都没留下

发布于2021-10-30 16:38:27

复现强化学习论文
研一，想去复现一篇强化学习论文，来提升自己的能力，请问各位大佬有什么推荐嘛，最好是最近几年的

赞 2

评论 1

浏览 1707

论文研讨
Jun Wang 汪军 Professor, Computer Science, UCL

发布于2021-09-27 16:16:46

Settling the Variance of Multi-Agent Policy Gradients
Policy gradient (PG) methods are popular reinforcement learning (RL) methods where a baseline is often applied to reduce the var...

赞 8

评论 1

浏览 1742

论文研讨
博文视点Broadview 博文视点，IT出版旗舰品牌，关注人工智能领域前沿技术与深度应用，出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧！让我们一起来抢占人工智能至高点！

发布于2021-12-07 09:23:04

解经典强化学习算法，搞定“阿尔法狗”下围棋
以上内容摘自《深度强化学习：基础、研究与应用》一书。想继续阅读的读者欢迎关注和购买此书阅读。《深度强化学习：基础、研究与应用》董豪、丁子涵、仉尚航等著一本书轻松上手深度学习 | 强化学习 | 模仿学习 | 集成学习 | 并行计算 | 多智能体强化...

赞

评论

浏览 1601

水区
A

A ACSync 这家伙很懒，什么都没留下

发布于2022-03-17 18:33:39

启元世界春招/实习开始啦！大量 hc，欢迎投递！
启元世界 = WLB + 技术提升 + 丰厚薪酬，具体岗位可见 http://inspirai.com/career 工作地点：北京，杭州，深圳可以获得：与国内最顶尖级的技术人才共事； 5 天 8 小时工作制，告别 996；接触最前沿的科技技术...

赞

评论

浏览 1662

招生招聘
米祈睿中科院自动化研究所2021级直博生~

发布于2022-02-11 23:00:32

圆桌论道 | AAAI 2022 强化学习相关 138 篇论文分类整理
圆桌论道 “圆桌论道”是 RLChina 的一个栏目，发布国内外前沿学术活动的预告、总结或解读等。导读 AAAI (Association for the Advance of Artificial Intelligence) 是由国际人工智能促进协会主...

赞 14

评论 1

浏览 6730

学术活动
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2021-09-29 16:11:28

前沿追踪 | 强化学习月度十大动态 2105 期：安卓模拟环境，Expire-Span 等
导读本推文整理了 2021 年 5 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、竞赛、观点等内容，全面覆盖 RL theory，multi-agent RL，offline RL，imitation RL，meta RL，RL applic...

赞 1

评论

浏览 1358

新闻动态
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2021-09-23 13:08:44

前沿追踪 | 强化学习月度十大动态 2108 期：数据高效强化学习，大模型机遇等
导读本推文整理了 2021 年 8 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，offline RL，Hierarchical RL，R...

赞 1

评论

浏览 2019

新闻动态
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2021-09-23 14:26:18

前沿追踪 | 强化学习月度十大动态 2107 期：通用能力的涌现，AI 斗地主等
导读本推文整理了 2021 年 7 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，imitation RL，RL application，AGI 等强化学习关键领域...

赞 2

评论

浏览 1874

新闻动态
RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于2021-09-28 17:34:15

前沿追踪 | 强化学习月度十大动态 2106 期：Decision Transformer，通用人工智能，芯片设计等
导读本推文整理了 2021 年 6 月强化学习十大学术动态，涵盖强化学习相关领域的论文、会议、教程、观点等内容，全面覆盖 RL theory，multi-agent RL，offline RL，RL application，AGI 等强化学习关键领域。月...

赞 1

评论

浏览 1924

新闻动态

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132