RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2022-08-08 16:21:39

    论文笔记 | In situ bidirectional human-robot value alignment 实时双向人机价值对齐

    Value Alignment Problem 导言 本文简述了 value alignment problem 的定义与提出背景,记录了学习论文“In situ bidirectional human-robot value alignment”时的笔记...
    赞 6
    评论 4
    浏览 1385
    论文研讨
  • myb
    myb myb 入坑没多久,求大神指导一二
    发布于6天前

    SMAC环境突然显存不够

    同样的代码在运行 SMAC 的环境的时候,corridor 和 2c_64z 从开始的占 4G 显存到后来会占用越来越多直到显示我 24G 的显存不够,这是什么原因,其他的地图都没有这个问题,是因为我下载的地图有问题吗,海事这两个地图就是这个样子
    赞 1
    评论
    浏览 29
    论文研讨
  • 马亿
    马亿 马亿 这家伙很懒,什么都没留下
    发布于6天前

    RLChina 论文研讨会第63期(2023.09.26直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 63 期论文研讨会将由天津大学博士生马亿主持,天津大学博士生李鹏翼和北京理工大学博士生赵一诺为大家分享最新的研究工作...
    赞
    评论
    浏览 131
    论文研讨
  • 薛
    薛 薛正海-NTU 这家伙很懒,什么都没留下
    发布于21天前

    RLChina 论文研讨会第62期 (2023.9.12直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 62 期论文研讨会将由新加坡南洋理工大学博士生薛正海主持,新加坡南洋理工大学博士生郑龙韬、南京大学硕士生林浩鑫、伦敦...
    赞
    评论
    浏览 232
    论文研讨
  • W
    W waterhorse 这家伙很懒,什么都没留下
    发布于2023-08-28 05:06:02

    RLChina 论文研讨会第60期(2023.8.29直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 60 期论文研讨会将由伦敦大学学院冯熙栋同学主持,香港中文大学博士生张策尧,伦敦大学学院博士生杨梦月为大家分享最新的研究工作,欢迎大...
    赞 1
    评论
    浏览 215
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2023-08-27 17:11:43

    圆桌论道 | ICML 2023 强化学习相关 231 篇论文分类整理

    圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 国际机器学习会议(International Conference on Machine Learning,简称 ICML)是机器学习领域最具影响力的...
    赞 3
    评论
    浏览 950
    论文研讨
  • 林润基
    林润基 林润基 中科院自动化所研究生,研究多智能体强化学习
    发布于2023-08-13 14:37:48

    RLChina 论文研讨会第59期(2023.08.15直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 59 期论文研讨会将由中科院自动化所林润基主持,阿里达摩院研究员袁正和上海交通大学博士生王翰竟 为大家分享最新的研究...
    赞
    评论 1
    浏览 296
    论文研讨
  • qmm
    qmm qmm 多智能体强化学习、分层强化学习、离散网格系统
    发布于2023-08-08 10:40:17

    大规模多智能体学习

    大家好,向大家咨询一些问题,智能体数量达到百万级别在多智体强化学习领域是可行的吗?有推荐的案例吗?比如一些论文或者应用? Hi guys, a few questions for you, is millions of agents feasible in...
    赞
    评论 1
    浏览 266
    论文研讨
  • Z
    Z zuwq_shanghaitech 这家伙很懒,什么都没留下
    发布于2023-08-01 10:51:36

    RLChina 论文研讨会第58期(2023.8.8直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 58 期论文研讨会将由上海科技大学硕士生祖伟钦主持,上海科技大学硕士生 刘浩新、伦敦国王学院博士生 Richard ...
    赞 1
    评论
    浏览 221
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2023-06-28 23:44:12

    IJCAI 2023 4篇 RL4Finance 论文整理

    本人在整理 IJCAI 2023 RL 相关论文 时,发现基于 RL 研究 economics、finance 问题的工作(竟然!)有 4 篇(而总体 RL 相关论文只有 66 篇),个人最近在研究计算经济学相关问题,因此自己学习的同时,将这 4 篇论文摘...
    赞 5
    评论 4
    浏览 707
    论文研讨
  • Criswim
    Criswim Criswim 这家伙很懒,什么都没留下
    发布于2023-07-18 23:07:15

    RLChina 论文研讨会第57期(2023.07.25直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 57 期论文研讨会将由国防科技大学博士生施伟主持,浙江大学博士生杜林康、国防科技大学博士生罗俊仁为大家分享最新的研究...
    赞
    评论
    浏览 389
    论文研讨
  • 自动化所姜纪文
    自动化所姜纪文 自动化所姜纪文 (ง •_•)ง
    发布于2023-07-16 00:40:22

    一文七问 | 论文分享:监督预训练可学习上下文强化学习

    @toc 导读 本篇推文将为大家介绍斯坦福在 RL 和 Pretrained Model 方面所作的探索工作:Supervised Pretraining Can Learn In-Context Reinforcement Learning。这篇论文提出...
    赞 1
    评论
    浏览 196
    论文研讨
  • S
    S sgz 这家伙很懒,什么都没留下
    发布于2023-07-11 21:14:34

    RLChina 论文研讨会第56期(2023.7.18直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 56 期论文研讨会将由中国科学技术大学硕士生喻言主持,中国科学技术大学博士生宋昊霖、中国科学技术大学博士生施余峰和南...
    赞
    评论
    浏览 355
    论文研讨
  • 王
    王 王梓岩 这家伙很懒,什么都没留下
    发布于2023-07-07 05:41:27

    RLChina 论文研讨会第55期(2023.7.11直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 55 期论文研讨会将由伦敦国王学院博士生王梓岩主持,图宾根人工智能中心博士生何强,南京大学博士生刘旭辉,曼彻斯特大学...
    赞 1
    评论
    浏览 638
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2023-06-28 23:11:55

    圆桌论道 | IJCAI 2023 强化学习相关 66 篇论文分类整理

    圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 国际人工智能联合会议(International Joint Conference on Artificial Intelligence, 简称为 I...
    赞 5
    评论 3
    浏览 1195
    论文研讨
  • Z
    Z zjduan 这家伙很懒,什么都没留下
    发布于2023-07-02 16:11:49

    RLChina 论文研讨会第54期(2023.7.4直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 54 期论文研讨会将由北京大学博士生段志健主持,由浙江大学博士生刘顺宇、哈佛大学博士生林涛为大家分享最新发表在 AA...
    赞
    评论 1
    浏览 297
    论文研讨
  • 薛
    薛 薛正海-NTU 这家伙很懒,什么都没留下
    发布于2023-05-30 22:50:35

    RLChina 论文研讨会第50期 (2023.6.6直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 50 期论文研讨会将由新加坡南洋理工大学博士生薛正海主持,浙江大学博士生邢东、南京大学硕士生陈烽、哈尔滨工业大学本科...
    赞
    评论 1
    浏览 477
    论文研讨
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2023-06-28 17:49:08

    Awesome 论文合集 |这些基于AI的蛋白质设计的论文,OpenDILab都帮你整理好了!(2)

    随着人工智能技术的发展与深化,AI 在计算生物领域的融合与发展也愈发深入。而蛋白质结构预测则是其中的一项重要工作。 OpenDILab 发布的 repo: Awesome AI-based Protein Design,这个 repo 致力于帮大家收录整理...
    赞
    评论
    浏览 124
    论文研讨
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2023-06-27 18:03:31

    Awesome 论文合集 |这些基于AI的蛋白质设计的论文,OpenDILab都帮你整理好了!(1)

    随着人工智能技术的发展与深化,AI 在计算生物领域的融合与发展也愈发深入。而蛋白质结构预测则是其中的一项重要工作。 OpenDILab 发布的 repo: Awesome AI-based Protein Design,这个 repo 致力于帮大家收录整理...
    赞
    评论
    浏览 106
    论文研讨
  • 昨
    昨 昨天的远方 这家伙很懒,什么都没留下
    发布于2023-06-19 12:44:16

    RLChina 论文研讨会第52期 (2023.6.20直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 52 期论文研讨会将由天津大学博士生郝晓田持,天津大学的郝晓田、吴吉洲、袁逸夫、李鹏翼、为大家分享最新的研究工作,欢...
    赞
    评论
    浏览 361
    论文研讨
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2023 ChatGPT 和大模型春季课程:http://rlchina.org/topic/652

三、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

四、RLChina 智能体挑战赛:http://rlchina.org/topic/216

五、RLChina 前沿讲习班:http://rlchina.org/topic/215

六、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 3 评论

    652
  • RLChina
    RLChina

    122 帖子 • 77 评论

    437
  • Frei0d
    Frei0d

    1 帖子 • 7 评论

    368
  • POLIXIR
    POLIXIR

    35 帖子 • 5 评论

    342
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • R
    Rlxia

    0 帖子 • 0 评论

    184
  • vinbo
    vinbo

    9 帖子 • 84 评论

    165
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    98
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室