RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于15天前

    UCL汪军呼吁创新:后ChatGPT通用人工智能理论及其应用

    本文原载于“机器之心”公众号,由 UCL 教授、上海数字大脑研究院院长汪军撰写,他呼吁我们不仅要复制 ChatGPT 的成功,更重要的是在以下人工智能领域推动开创性研究和新的应用开发。 *本文原为英文写作,中文由 ChatGPT 翻译完成,原貌呈现,少数歧...
    赞 1
    评论
    浏览 100
    产业应用
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2023-02-07 11:53:45

    极限汽车运动控制 全矢量协同控制技术

    极限汽车运动控制 汽车作为拥有数千部件的复杂系统,长久以来,通过不同模块之间的互相制衡与协同,在固化的功能中找到折衷方案,保证变化路况下人们的驾驶安全。 未来的智能化车辆控制,不但要求在极端状况下保持车身的稳定性,如高速爆胎和动态附着路面下的驾乘安全,同时...
    赞
    评论
    浏览 169
    产业应用
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-11-30 16:27:27

    产业速递|数字世界里的足球——数研院探索多智能体足球AI并取得新突破

    世界杯终于回来了,经历了疫情的三年时光,全世界的球迷都尤其期盼着这个也许是人类历史上意义仅次于 1948 年伦敦奥运会的盛大赛事——2022 卡塔尔世界杯。 1863 年,英国足球协会在伦敦正式成立,标志着真正意义上的现代足球诞生了。在这一百多年的发展中,...
    赞 1
    评论 1
    浏览 257
    产业应用
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-11-04 19:35:38

    强化学习工业软件&预训练模型|南栖仙策最新发布

    摘要: 11 月 3 日南栖仙策通用智能决策 2022 发布会,介绍了强化学习工业软件 REVIVE 的最新版本,更为惊艳的是,发布了首个工业控制预训练模型。可以预见到,强化学习,这一曾经在围棋上战胜人类的 AI 技术,将为工业场景带来巨大变革。 点击南栖...
    赞 3
    评论
    浏览 356
    产业应用
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-10-27 19:02:33

    【峰会活动】决策智能产业化论坛内容回顾

    近期,DataFun 与上海数字大脑研究院联合举办了决策智能在线峰会,邀请决策智能领域学术与产业专家共话技术与产业。上海数字大脑研究院出品了以「决策智能产业化」为主题的在线论坛,上海数字大脑研究院执行 CEO、CMC Capital VP 刘海涛担任论坛出...
    赞
    评论
    浏览 200
    产业应用
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-09-26 14:45:18

    万事开头难?喵小DI玩“羊了个羊”可不难

    Hello,大家好呀,喵小 DI 又来了 ~ 最近大家是不是都在玩《羊了个羊》? 喵小 DI 也尝试了下,本来想着凭借本喵超高的智商,过第二关简直易如反掌,结果还是,惨败:( 喵小 DI 又尝试了 N+1 下,本来想着再凭借本喵超高的智商,过第二关还不易...
    赞 2
    评论
    浏览 559
    产业应用
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-09-01 18:37:11

    数研院首次发布《2022上半年度人工智能行业报告》,多层面深度分析全球AI发展

    随着科技进步和产业变革的加速演进,人工智能技术已成为各国必争的科技创新高地。放眼全球,在机构、产业、政府等各个层面,人工智能都受到高度重视,被认为是新基建的重要支撑,可以带来“新基遇”。得益于此,其在学术研究、产业技术创新等方面都呈现出全新的发展态势。 近...
    赞 1
    评论
    浏览 394
    产业应用
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-08-09 21:58:07

    OpenDILab提出InterFuser自动驾驶策略,凭借超强性能获居CARLA Leaderboard首位

    介绍一下 OpenDILab 团队最新提出的自动驾驶策略 InterFuser(Interpretable Sensor Fusion Transformer)。该策略基于 Transformer 进行多传感器融合的和使用可解释性特征增加自动驾驶的安全性,...
    赞 2
    评论
    浏览 398
    产业应用
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-08-09 16:47:02

    「仙启教学视频」REVIVE SDK 行业应用——大滞后控制案例,使用数据驱动强化学习(离线强化学习)开发工具包,解决行业问题

    「仙启」REVIVE SDK 行业应用,控制系列教程,结合工业控中大滞后控制案例展示如何使用 REVIVE 工具去解决工业控制中这一问题,教学视频已发布,欢迎小伙伴们查阅。 视频观看,详见南栖仙策 B 站: REVIVE SDK 行业应用大滞后控制案例 【...
    赞
    评论
    浏览 416
    产业应用
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-06-28 17:08:01

    解决这两个世界级难题,自动驾驶就能够实现超进化?

    引言 自动驾驶领域近几年来一直备受关注,但截止目前,自动驾驶在现实复杂场景下的大规模部署应用却一再延后。 其中一个很重要的原因是,目前业界对于动态和强交互性场景下的行为、轨迹预测问题(behavior prediction)始终没有得出很好的解决方案。缺乏...
    赞
    评论
    浏览 349
    产业应用
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2021-12-16 18:14:41

    NeoRL: 接近真实世界的离线强化学习基准

    众所周知,强化学习(RL)在游戏界的成功已经在 AI 界产生了轰动 ,不管是玩出历史高分的微软 AI,还是继围棋之后,人工智能又攻克的德州扑克,亦或是利用“左右互搏”来增强学习的 OpenAI。人工智能在不同的游戏中的最新得分已经超越了人类的水平。 当大家...
    赞 2
    评论
    浏览 650
    产业应用
  • vinbo
    vinbo vinbo The whole life is a game...
    发布于2021-11-12 14:01:52

    大家收到这个AI项目合作邀请信了吗?

    我在 b 站收到的 你好 我们是一个加密货币 NFT 方面的团队,现在想做一些和 AI 有关的 NFT 项目,就是以 AI 本身为 NFT 进行交易的一个 GAMEFI 项目,AI 角色通过训练后,作为 NFT 装备包本身,进行交易。但我们对 AI 这块有...
    赞 4
    评论 5
    浏览 594
    产业应用
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-13 08:59:50

    请问大佬,我的DDPG算法不收敛是什么原因?

    DDPG 算法不收敛是我采样的数据随机性太大了吗
    赞
    评论 2
    浏览 871
    产业应用
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-11 17:41:34

    请问大佬FrozenLake中的FrozenLake-v1这个环境 “由于是冰面,每次行走有一定的概率滑行到附近的其它状态” 这句话应该怎么理解?

    也就是说状态转移中 在第 0 个状态下采取动作 0 后面跟的这三个四元组怎么理解? 0(state): {0(action): [(0.3333333333333333, 0, 0.0, False), (0.3333333333333333, 0, 0...
    赞
    评论 2
    浏览 603
    产业应用
  • Z
    Z zhangmou266 这家伙很懒,什么都没留下
    发布于2021-10-09 19:39:08

    强化学习在机器人领域的应用

    在人机交互的场景中,对于非常耗时的强化学习过程有什么 替代人类参与机器人学习过程的应对策略吗?
    赞 1
    评论
    浏览 585
    产业应用
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 强化学习暑期课(每年):http://rlchina.org/topic/491

三、RLChina 智能体挑战赛(每季):http://rlchina.org/topic/216

四、RLChina 前沿讲习班(每月):http://rlchina.org/topic/215

五、RLChina 论文研讨会(每周):http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 3 评论

    494
  • RLChina
    RLChina

    116 帖子 • 77 评论

    412
  • POLIXIR
    POLIXIR

    33 帖子 • 5 评论

    334
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    214
  • Frei0d
    Frei0d

    1 帖子 • 7 评论

    210
  • vinbo
    vinbo

    9 帖子 • 84 评论

    164
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    98
  • daydayup
    daydayup

    4 帖子 • 34 评论

    84
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室