RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于2021-10-24 18:00:38

    RLChina 组织形式

    RLChina 目前由学术委员会、编辑部、校园学习小组 3 个部分构成,分别起到学术引领、信息发布、学习交流的作用。 RLChina 学术委员会 RLChina 学术委员会于 2021 年 10 月 22 日成立,将致力于促进决策智能领域的“产学研”发展。...
    赞 17
    评论 1
    浏览 3373
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于11天前

    前沿追踪 | 强化学习月度十大动态 2302 期:微软使用ChatGPT控制机器人,加州大学伯克利分校利用大语言模型指导探索等

    导读 本推文整理了 2023 年 2 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 129
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-02-08 10:16:10

    前沿追踪 | 强化学习月度十大动态 2301 期:基于世界模型的通用算法,通过文本-图像生成学习通用策略等

    导读 本推文整理了 2023 年 1 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 230
    新闻动态
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-02-01 14:52:38

    让所行皆为坦途 | 数研院探索大模型跨地形、具身四足机器人控制取得突破

    近日,上海数字大脑研究院(简称“数研院”)成功用强化深度学习方法,将 Transformer 大模型应用于四足机器人跨地形、跨具身运动控制,让不同具身的四足机器人成功在多种真实复杂地形上“化险为夷”,如履平地,为自由、自主的运动控制奠定基础。相关成果以两篇...
    赞
    评论
    浏览 227
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2023-01-09 18:25:42

    前沿追踪 | 强化学习月度十大动态 2212 期:谷歌开源机器人领域transformer,西洋双陆棋智能体登上Science等

    导读 本推文整理了 2022 年 12 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,...
    赞
    评论
    浏览 213
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-12-10 16:38:03

    前沿追踪 | 强化学习月度十大动态 2211 期:Meta提出AI外交模型,ChatGPT免费开放等

    导读 本推文整理了 2022 年 11 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,...
    赞 2
    评论
    浏览 338
    新闻动态
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-12-09 14:05:06

    上海数字大脑研究院入选「甲子20」2022中国人工智能领域最具商业潜力科技企业TOP20

    本周,2022「甲子引力」年终盛典大会开幕。作为中国领先的科技产业智库,甲子光年在过去五年间见证了中国科技产业的突飞猛进和数字经济的日新月异,也经历了数字化进程从“少数人的路”到“行至水深处”的变迁。 大会首日颁布了「甲子 20」榜单,以表彰中国科技产业的...
    赞
    评论
    浏览 208
    新闻动态
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-11-30 17:07:29

    以决策智能赋能产业升级,数研院获评36Kr 「Wise 2022 新经济之王前沿科技领域年度企业」

    2022 年 11 月 29 日,上海数字大脑研究院(简称“数研院”)凭借在决策智能领域的创新实践,获评由 36Kr 发起的 Wise 2022 新经济之王前沿科技领域年度企业,一同入选的还有科大讯飞、火山引擎等行业头部企业。 据权威机构研究,2021 ...
    赞
    评论
    浏览 166
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-11-06 22:09:22

    前沿追踪 | 强化学习月度十大动态 2210 期:DeepMind发现快速矩阵乘法算法,加州伯克利分校训练四足机器人守门员等

    导读 本推文整理了 2022 年 10 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,...
    赞
    评论
    浏览 347
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-10-15 10:50:01

    前沿追踪 | 强化学习月度十大动态 2209 期:斯坦福大学提出社会人工智能,DeepMind构建安全对话智能体Sparrow等

    导读 本推文整理了 2022 年 9 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 343
    新闻动态
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-09-30 11:23:05

    上汽集团创新研究开发总院与上海数字大脑研究院达成战略合作

    近日,上汽集团创新研究开发总院(简称“上汽创新研发总院”)试验认证部与上海数字大脑研究院(以下简称“数研院”)达成战略合作,双方将成立汽车试制试验智能决策联合实验室,进行关键技术的联合研究,后期持续深度推进决策智能在汽车行业的应用落地。 上汽创新研发总院...
    赞 1
    评论
    浏览 352
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-09-13 14:24:36

    前沿追踪 | 强化学习月度十大动态 2208 期:普渡大学利用RL进行蛋白质拼接,牛津大学提出强化学习任务自动机等

    导读 本推文整理了 2022 年 8 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 463
    新闻动态
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-09-09 10:46:52

    【峰会活动】由DataFun与数研院联合主办的决策智能在线峰会日程重磅发布!

    2022 年 9 月 24 日,由 DataFun 与上海数字大脑研究院联合举办的 DataFunSummit 2022 决策智能峰会将如约而至。在本次峰会中,上海数字大脑研究院院长汪军担任学术主席,与 3 位峰会主席联合 9 位出品人共同架构了论坛设置,...
    赞 1
    评论
    浏览 397
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-08-05 20:55:04

    前沿追踪 | 强化学习月度十大动态 2207 期:芝加哥大学提出对比UCB算法,华为将离线学习应用于混合整数规划问题等

    导读 本推文整理了 2022 年 7 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 462
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-07-07 10:21:07

    前沿追踪 | 强化学习月度十大动态 2206 期:RL攻克Stratego,伯克利研究可交互编队学习方法等

    导读 本推文整理了 2022 年 6 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 2
    评论
    浏览 522
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-06-12 00:15:30

    前沿追踪 | 强化学习月度十大动态 2205 期:通用AI智能体Gato,上海数字大脑研究院等研究使用序列模型求解MARL等

    导读 本推文整理了 2022 年 5 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 1
    评论
    浏览 568
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-05-06 16:18:26

    前沿追踪 | 强化学习月度十大动态 2204 期:谷歌研究RL初始化问题,CMU与DEE将离线蒸馏技术应用在机器人终身学习等

    导读 本推文整理了 2022 年 4 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 590
    新闻动态
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-04-20 14:42:44

    汽车标定技术研究 | 南栖仙策编写《汽车虚拟标定白皮书》

    在“双碳”大趋势下,燃油汽车亟需提高技术指标,以面对愈发严格的整车性能标准考核及市场份额的持续下滑趋势。标定是汽车研发的关键环节,直接影响汽车的技术指标,然而传统基于专家或模型的标定方法耗时长、成本高,并不能化解车企面临的困境,而新兴的 AI 技术可提供超...
    赞
    评论
    浏览 324
    新闻动态
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-04-19 21:08:45

    强化学习工业控制技术研究 | 南栖仙策编写《强化学习控制白皮书》

    能源与流程工业制造是国民经济的支柱产业,伴随着过去几十年工业制造的高速发展,我国工业生产面临的能耗高、资源消耗高、产品附加值低、环境污染等问题越来越突出,亟需通过最新的人工智能技术来推动流程工业制造高效化、绿色化、智能化发展。 强化学习是一种数据驱动的决策...
    赞
    评论
    浏览 490
    新闻动态
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2022-04-06 10:20:29

    前沿追踪 | 强化学习月度十大动态 2203 期:谷歌使用自然语言指导机器人行动,DeepMind发布AlphaCode系统等

    导读 本推文整理了 2022 年 3 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 843
    新闻动态
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 强化学习暑期课(每年):http://rlchina.org/topic/491

三、RLChina 智能体挑战赛(每季):http://rlchina.org/topic/216

四、RLChina 前沿讲习班(每月):http://rlchina.org/topic/215

五、RLChina 论文研讨会(每周):http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 3 评论

    494
  • RLChina
    RLChina

    116 帖子 • 77 评论

    412
  • POLIXIR
    POLIXIR

    33 帖子 • 5 评论

    334
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    214
  • Frei0d
    Frei0d

    1 帖子 • 7 评论

    210
  • vinbo
    vinbo

    9 帖子 • 84 评论

    164
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    98
  • daydayup
    daydayup

    4 帖子 • 34 评论

    84
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室