RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 赵
    赵 赵鉴 这家伙很懒,什么都没留下
    发布于6天前

    RLChina 论文研讨会第43期(2022.03.21直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。第 43 期论文讨论会将由中国科学技术大学硕士生阳明宇,中国科学技术大学博士生王治海,西湖大学博士生庄梓峰为大家分享最新发...
    赞
    评论 2
    浏览 145
    论文研讨
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于1天前

    探寻智能体自己的语言——迈向人机交互强化学习

    在人机交互场景中,强化学习能够训练智能体按照人类语言指令完成任务。 以往的算法通常直接将人类语言提供给智能体,然后使用强化学习优化方法来提升智能体的策略,以完成人类指定的任务。然而,人类语言的学习难度高,与解决具体决策任务的复杂度不相匹配。为此,南栖仙策和...
    赞 1
    评论
    浏览 23
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于23天前

    圆桌论道 | ICLR 2023 强化学习相关 209 篇论文分类整理

    “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 ICLR (International Conference on Learning Representations) 是一年一度的国际学术会议,主要聚焦于机器...
    赞 11
    评论 1
    浏览 2037
    论文研讨
  • 戴扬
    戴扬 戴扬 = 。=
    发布于19天前

    RLChina 论文研讨会第42期(2023.3.7直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 42 期论文研讨会将由国防科技大学硕士生戴扬主持,国防科技大学博士生徐浩添、国防科技大学博士生阳方杰为大家分享最新的...
    赞
    评论
    浏览 174
    论文研讨
  • 王
    王 王梓岩 这家伙很懒,什么都没留下
    发布于2023-02-17 11:26:17

    RLChina 论文研讨会第40期(2023.2.21直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 40 期论文研讨会将由伦敦国王学院博士生王梓岩主持,悉尼科技大学博士生史紫荆、北京大学博士生段志健为大家分享最新的研...
    赞
    评论
    浏览 206
    论文研讨
  • P
    P pangjc 这家伙很懒,什么都没留下
    发布于2023-01-30 16:47:45

    RLChina 论文研讨会第38期(2023.02.07直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 38 期论文讨论会将由南京大学博士生庞竟成同学主持,南京大学人工智能学院的廖沩健和张福翔与大家分享发表在 AAAI ...
    赞
    评论
    浏览 271
    论文研讨
  • 马亿
    马亿 马亿 这家伙很懒,什么都没留下
    发布于2023-01-11 17:18:02

    RLChina 论文研讨会第37期(2023.01.17直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 37 期论文研讨会将由天津大学博士生马亿主持,北京理工大学博士生戴子彭 、清华大学硕士生高崇凯和天津大学本科生梁贺斌...
    赞
    评论
    浏览 245
    论文研讨
  • SolidMind
    SolidMind SolidMind 这家伙很懒,什么都没留下!
    发布于2022-12-23 22:13:40

    RLChina 论文研讨会第34期(2022.12.27直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 34 期论文研讨会将由南洋理工大学博士生邱伟主持,南洋理工大学博士生李姝昕、新加坡国立大学博士生马一宁以及法国国立计算机与自动化研究...
    赞 1
    评论 3
    浏览 463
    论文研讨
  • W
    W wjh720 这家伙很懒,什么都没留下
    发布于2023-01-04 22:42:33

    RLChina 论文研讨会第36期(2023.01.10直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 36 期论文研讨会将由清华大学博士生王鉴浩主持,清华大学博士后陈晰、清华大学博士生张进和清华大学博士生杨以钦为大家分...
    赞 1
    评论
    浏览 322
    论文研讨
  • xjtu-ipdc
    xjtu-ipdc xjtu-ipdc 西安交通大学智能感知与决策研究中心
    发布于2022-12-27 14:59:10

    RLChina 论文研讨会第35期(2023.01.03直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 35 期论文研讨会将由西安交通大学博士生郝磊主持,南京大学博士生袁雷和南京大学博士生薛轲为大家分享最新的研究工作,欢...
    赞
    评论
    浏览 284
    论文研讨
  • E
    E EricLiu 这家伙很懒,什么都没留下
    发布于2022-12-13 09:33:22

    RLChina 论文研讨会第33期(2022.12.20直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。第 33 期论文讨论会将由上海交通大学博士研究生刘明桓主持,南洋理工大学博士研究生邱伟,浙江大学硕士研究生万旭,为大家分享...
    赞
    评论
    浏览 349
    论文研讨
  • W
    W waterhorse 这家伙很懒,什么都没留下
    发布于2022-12-05 09:47:25

    RLChina 论文研讨会第32期(2022.12.13直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 32 期论文研讨会将由伦敦大学学院冯熙栋同学主持,中科院研究助理刘博、爱丁堡大学博士生任杰为大家分享最新发表在 NeurIPS 等顶...
    赞
    评论
    浏览 405
    论文研讨
  • R
    R ryanxhr 这家伙很懒,什么都没留下
    发布于2022-11-27 14:17:57

    RLChina 论文研讨会第31期(2022.11.29直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 31 期论文研讨会将由京东科技研究员徐浩然主持,清华大学硕士生姜力、清华大学硕士生牛浩懿和清华大学博士生李健雄为大家...
    赞 3
    评论
    浏览 504
    论文研讨
  • Z
    Z zuwq_shanghaitech 这家伙很懒,什么都没留下
    发布于2022-11-08 19:32:07

    RLChina 论文研讨会第29期(2022.11.15直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 29 期论文研讨会将由上海科技大学硕士生祖伟钦主持,上海科技大学硕士生郭亨铨、伦敦大学学院博士生蒋铮尧和中科院自动化...
    赞
    评论 1
    浏览 567
    论文研讨
  • 阮
    阮 阮景晴 这家伙很懒,什么都没留下
    发布于2022-11-18 23:11:34

    RLChina 论文研讨会第30期(2022.11.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 30 期论文研讨会将由清华大学博士生吕加飞和中科院自动化研究所博士生徐志伟为大家分享最新的研究工作,欢迎大家参与。 ...
    赞
    评论
    浏览 363
    论文研讨
  • Whale
    Whale Whale 中山大学计算机学院研究生
    发布于2022-11-01 15:14:50

    RLChina 论文研讨会第28期(2022.11.08直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。第 28 期论文讨论会将由中山大学研究生郑学敬同学主持,中山大学研究生刘宗凯、中山大学研究生吴梓帆为大家分享最新发表在 N...
    赞
    评论
    浏览 472
    论文研讨
  • Criswim
    Criswim Criswim 这家伙很懒,什么都没留下
    发布于2022-10-25 21:29:17

    RLChina 论文研讨会第27期(2022.11.01直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 27 期论文研讨会将由国防科技大学博士生施伟主持,国防科技大学博士生王琦、国防科技大学博士生刘世旋为大家分享最新的研...
    赞
    评论
    浏览 545
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2022-08-08 16:21:39

    论文笔记 | In situ bidirectional human-robot value alignment 实时双向人机价值对齐

    Value Alignment Problem 导言 本文简述了 value alignment problem 的定义与提出背景,记录了学习论文“In situ bidirectional human-robot value alignment”时的笔记...
    赞 5
    评论 3
    浏览 937
    论文研讨
  • 冲
    冲 冲鸭鸭 这家伙很懒,什么都没留下
    发布于2022-06-17 10:22:44

    强化学习中的绘制带阴影的曲线图

    想请问下论文里的这种图怎么画出来的呢?可以用 matplotlib 吗 此外,这种图是要运行同一个实验得到多个结果才能画出来吗
    赞
    评论 8
    浏览 804
    论文研讨
  • 赵
    赵 赵鉴 这家伙很懒,什么都没留下
    发布于2022-07-19 11:22:22

    RLChina 论文研讨会第26期(2022.07.26直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 26 期论文研讨会将由中国科学技术大学博士生赵鉴主持,中国科学技术大学博士生杨睿,南京大学研究生王丽,西安交通大学博...
    赞
    评论 1
    浏览 864
    论文研讨
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 强化学习暑期课(每年):http://rlchina.org/topic/491

三、RLChina 智能体挑战赛(每季):http://rlchina.org/topic/216

四、RLChina 前沿讲习班(每月):http://rlchina.org/topic/215

五、RLChina 论文研讨会(每周):http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 3 评论

    494
  • RLChina
    RLChina

    116 帖子 • 77 评论

    412
  • POLIXIR
    POLIXIR

    33 帖子 • 5 评论

    334
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    214
  • Frei0d
    Frei0d

    1 帖子 • 7 评论

    210
  • vinbo
    vinbo

    9 帖子 • 84 评论

    164
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    98
  • daydayup
    daydayup

    4 帖子 • 34 评论

    84
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室