RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • Error_666
    Error_666 Error_666 Work hard, be nice.
    发布于2024-10-07 22:39:11

    TD时序差分算法的off-policy version的疑问

    目前对 off-policy 的理解是,生成 experience 数据的 policy 与优化出的 policy 不同。 那么如果是这样的话,与 on-policy 相比,感觉很难得到真正的最优 policy,因为它是在生成 experience 数据的...
    赞
    评论 2
    浏览 470
    水区
  • Willing Star
    Willing Star Willing Star 这家伙很懒,什么都没留下
    发布于2024-04-22 15:56:15

    通用决策模型路在何方?

    有同学在研究决策通用模型吗?不知道这个发现会向那个方向发展。目前的一些思路比如传统的 meta-RL、domain adaption for RL、decision transformer 类的工作如 Gato、VLM 策略如 RT 系列,还有通用环境模型...
    赞 2
    评论 3
    浏览 616
    水区
  • K
    K Kenan.Guan 这家伙很懒,什么都没留下
    发布于2024-04-07 17:05:17

    RL模型的特征选择问题

    求问大家,RL 模型一般用什么方法进行特征选择呢?选择到不好的特征会多大程度上影响 RL 模型的学习效果? 我在网上看了很久,没有看到很多有关于这方面的研究。
    赞
    评论 2
    浏览 645
    学术活动
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2024-03-24 12:58:40

    圆桌论道 | ICLR 2024 强化学习和 LLM 相关573篇论文整理

    圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 国际学习表征会议(International Conference on Learning Representations, 简称 ICLR)是计算机...
    赞 12
    评论 2
    浏览 9398
    论文研讨
  • pan95732
    pan95732 pan95732 pan95732
    发布于2023-09-04 11:52:57

    【兼职】专业不限,只要你本专业知识扎实即可胜任!

    【介绍】 我们是一家专注于为大学生群体提供课后习题答疑的教育机构,采用网络 1 对 1 的答疑形式。在这里,我们能提供不同难度的习题辅导的机会。只要您有电脑,学习成绩优秀,在空闲时解题,然后用文字 or 文档的形式给学生答疑解惑即可。 【时间】 我们是灵活...
    赞 1
    评论 2
    浏览 671
    招生招聘
  • microyu
    microyu microyu https://github.com/gxywy
    发布于2021-10-09 19:29:14

    推荐强化学习绘图库rl-plotter

    非常实用的强化学习绘图库,一行命令就能搞定强化学习算法的学习曲线,详见 Github 页面 更新了预览图片,欢迎大家点赞本贴和 star 支持~ rl-plotter This is a simple tool which can plot lear...
    赞 24
    评论 21
    浏览 4477
    实用工具
  • 是Megan呀
    是Megan呀 是Megan呀 认真了解RL的萌新一枚!
    发布于2022-12-29 14:14:15

    【量化交易公司招聘】招聘强化学习方向实习生

    #正定私募招实习生 🙌 量化研究-强化学习方向 工作内容 研究 RL 在量化交易中的应用 要求 1.国内外重点院校硕博生,至少实习 3 个月 2.有较为丰富的 RL 经验 3.掌握 Python,熟练使用各种机器学习工具 4.数学/机器学习知识扎实 ,有顶...
    赞 2
    评论 5
    浏览 1610
    招生招聘
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2023-06-28 23:44:12

    IJCAI 2023 4篇 RL4Finance 论文整理

    本人在整理 IJCAI 2023 RL 相关论文 时,发现基于 RL 研究 economics、finance 问题的工作(竟然!)有 4 篇(而总体 RL 相关论文只有 66 篇),个人最近在研究计算经济学相关问题,因此自己学习的同时,将这 4 篇论文摘...
    赞 6
    评论 4
    浏览 1873
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2023-06-28 23:11:55

    圆桌论道 | IJCAI 2023 强化学习相关 66 篇论文分类整理

    圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 国际人工智能联合会议(International Joint Conference on Artificial Intelligence, 简称为 I...
    赞 6
    评论 3
    浏览 3089
    论文研讨
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-16 15:51:21

    ChatGPT和大模型春季课程Day4:港中文(深圳)助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为专题报告、实践课和话题讨论三个部分。 今天【ChatGPT 和大...
    赞
    评论 5
    浏览 1157
    课程学习
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2021-11-27 01:48:33

    圆桌论道 | NeurIPS 2021 强化学习相关 386 篇论文分类整理

    导读 NeurIPS (Annual Conference on Neural Information Processing Systems)会议于 1987 年在加拿大创办,是人工智能、机器学习领域的顶级会议(CCF-A 类)。NeurIPS 2021 ...
    赞 24
    评论 5
    浏览 6745
    学术活动
  • 帅小伙
    帅小伙 帅小伙 这家伙很懒,什么都没留下
    发布于2021-10-30 16:38:27

    复现强化学习论文

    研一,想去复现一篇强化学习论文,来提升自己的能力,请问各位大佬有什么推荐嘛,最好是最近几年的
    赞 2
    评论 1
    浏览 1287
    论文研讨
  • Jun Wang 汪军
    Jun Wang 汪军 Jun Wang 汪军 Professor, Computer Science, UCL
    发布于2021-09-27 16:16:46

    Settling the Variance of Multi-Agent Policy Gradients

    Policy gradient (PG) methods are popular reinforcement learning (RL) methods where a baseline is often applied to reduce the var...
    赞 8
    评论 1
    浏览 1329
    论文研讨
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-12-07 09:23:04

    解经典强化学习算法,搞定“阿尔法狗”下围棋

    以上内容摘自《深度强化学习:基础、研究与应用》一书。想继续阅读的读者欢迎关注和购买此书阅读。 《深度强化学习:基础、研究与应用》 董豪、丁子涵、仉尚航等 著 一本书轻松上手深度学习 | 强化学习 | 模仿学习 | 集成学习 | 并行计算 | 多智能体强化...
    赞
    评论
    浏览 1181
    水区
  • A
    A ACSync 这家伙很懒,什么都没留下
    发布于2022-03-17 18:33:39

    启元世界春招/实习开始啦!大量 hc,欢迎投递!

    启元世界 = WLB + 技术提升 + 丰厚薪酬,具体岗位可见 http://inspirai.com/career 工作地点:北京,杭州,深圳 可以获得: 与国内最顶尖级的技术人才共事; 5 天 8 小时工作制,告别 996; 接触最前沿的科技技术...
    赞
    评论
    浏览 1237
    招生招聘
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2022-02-11 23:00:32

    圆桌论道 | AAAI 2022 强化学习相关 138 篇论文分类整理

    圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 AAAI (Association for the Advance of Artificial Intelligence) 是由国际人工智能促进协会主...
    赞 14
    评论 1
    浏览 5971
    学术活动
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2021-09-29 16:11:28

    前沿追踪 | 强化学习月度十大动态 2105 期:安卓模拟环境,Expire-Span 等

    导读 本推文整理了 2021 年 5 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、竞赛、观点等内容,全面覆盖 RL theory,multi-agent RL,offline RL,imitation RL,meta RL,RL applic...
    赞 1
    评论
    浏览 988
    新闻动态
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2021-09-23 13:08:44

    前沿追踪 | 强化学习月度十大动态 2108 期:数据高效强化学习,大模型机遇等

    导读 本推文整理了 2021 年 8 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论
    浏览 1565
    新闻动态
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2021-09-23 14:26:18

    前沿追踪 | 强化学习月度十大动态 2107 期:通用能力的涌现,AI 斗地主等

    导读 本推文整理了 2021 年 7 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,RL application,AGI 等强化学习关键领域...
    赞 2
    评论
    浏览 1290
    新闻动态
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2021-09-28 17:34:15

    前沿追踪 | 强化学习月度十大动态 2106 期:Decision Transformer,通用人工智能,芯片设计等

    导读 本推文整理了 2021 年 6 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,offline RL,RL application,AGI 等强化学习关键领域。月...
    赞 1
    评论
    浏览 1376
    新闻动态
签到
0
立即签到
合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    905
  • R
    Rlxia

    0 帖子 • 0 评论

    566
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链