RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • microyu
    microyu microyu https://github.com/gxywy
    发布于2021-10-09 19:29:14

    推荐强化学习绘图库rl-plotter

    非常实用的强化学习绘图库,一行命令就能搞定强化学习算法的学习曲线,详见 Github 页面 更新了预览图片,欢迎大家点赞本贴和 star 支持~ rl-plotter This is a simple tool which can plot lear...
    赞 24
    评论 21
    浏览 4452
    实用工具
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-07-14 10:37:45

    「仙启教学视频」基于VS Code的POLIXIR REVIVE SDK 开发,数据驱动强化学习(离线强化学习)开发工具包辅助插件

    基于 VS Code 的 POLIXIR REVIVE SDK 开发,数据驱动强化学习(离线强化学习)开发工具包辅助插件教学视频已发布,欢迎小伙伴们查阅观看! 视频观看,详见南栖仙策 B 站:基于 VS Code 的 POLIXIR REVIVE SDK ...
    赞
    评论 5
    浏览 1175
    实用工具
  • Atongmu
    Atongmu Atongmu Let's play games, shall we?
    发布于2022-08-31 10:00:58

    开源贴!欢迎大家来戳!

    我们开源了 TimeChamber https://github.com/inspirai/TimeChamber 一个基于 IsaacGym 大规模并行 Self-Play 框架,只需要 1 个 GPU 跑训练! 欢迎大家来戳!
    赞 4
    评论 1
    浏览 1048
    实用工具
  • Inspir-AI
    Inspir-AI Inspir-AI hello world~
    发布于2022-08-31 10:03:51

    TimeChamber开源了!

    我们开源了 TimeChamber https://github.com/inspirai/TimeChamber 一个基于 IsaacGym 大规模并行 Self-Play 框架,只需要 1 个 GPU 跑训练! 欢迎大家来戳!
    赞
    评论
    浏览 1078
    实用工具
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2022-08-24 10:30:21

    星际争霸II协作对抗基准超越SOTA,新型Transformer架构解决多智能体强化学习问题

    “这项工作又让我们回到那个老生常谈的问题:Transformer 真的是万能的吗?” 多智能体强化学习 (MARL) 是一个具有挑战性的问题,它不仅需要识别每个智能体的策略改进方向,而且还需要将单个智能体的策略更新联合起来,以提高整体性能。最近,这一问题得...
    赞 4
    评论
    浏览 1139
    实用工具
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-07-05 14:01:28

    「仙启」REVIVE SDK下载与安装(基于Docker),数据驱动强化学习(离线强化学习)开发工具包

    数据驱动强化学习(离线强化学习)开发工具包 REVIVE SDK 下载与安装(基于 Docker)的教学视频已发布,欢迎小伙伴们查阅观看! 视频观看,详见南栖仙策 B 站:REVIVE SDK 下载与安装(基于 Docker) 【POLIXIR REVIV...
    赞
    评论
    浏览 1038
    实用工具
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-07-04 15:29:10

    【REVIVE SDK版本更新】REVIVE SDK 0.7.2版正式发布

    REVIVE SDK 0.7.2 版正式发布,欢迎小伙伴们下载使用。 1、REVIVE SDK 0.7.2 下载地址:REVIVE SDK 首页 2、REVIVE SDK 0.7.2 文档地址: REVIVE 帮助中心 3、REVIVE SDK 0.7....
    赞
    评论
    浏览 925
    实用工具
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-07-01 16:34:12

    【REVIVE IDE发布】POLIXIR REVIVE For VS Code 1.0正式发布

    POLIXIR REVIVE For VS Code 1.0 正式发布,欢迎小伙伴们下载试用。 1、POLIXIR REVIVE For VS Code 1.0 正式发布: https://marketplace.visualstudio.com/item...
    赞
    评论
    浏览 902
    实用工具
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-05-20 10:49:32

    「仙启」REVIVE SDK快速入门系列教程,玩转数据驱动强化学习(离线强化学习)开发工具包

    「仙启」REVIVE SDK 快速入门系列教程,结合冰箱温控案例展示如何使用 REVIVE 工具去完成自己的决策任务。 1、强化学习基础概念 2、使用尽可能少的数学公式和代码展示如何使用 REVIVE 工具去完成自己的决策任务 视频观看,详见南栖仙策 B ...
    赞 1
    评论
    浏览 1083
    实用工具
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2022-05-20 10:41:27

    「仙启」REVIVE SDK下载与安装,数据驱动强化学习(离线强化学习)开发工具包

    数据驱动强化学习(离线强化学习)开发工具包教学视频已发布,欢迎小伙伴们查阅观看! 视频观看,详见南栖仙策 B 站: https://www.bilibili.com/video/BV1iZ4y187Fs 【POLIXIR REVIVE SDK 简介】 南...
    赞 2
    评论
    浏览 1025
    实用工具
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-05-16 18:48:02

    混合动作空间|揭秘创造人工智能的黑魔法(1)

    OpenDILab 新开设了混合动作空间专栏,将从离散动作空间和连续动作空间入手,为大家介绍混合动作空间的起源和发展,并解读一系列学术界相关 paper。 本文作为混合动作空间系列专题文章的第一篇,主要是介绍混合动作空间的类型以及经典环境。 近年来,强化学...
    赞 1
    评论
    浏览 1440
    实用工具
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-03-09 21:45:50

    可能是最全的 | 适合决策AI研究的自动驾驶模拟器评测(上篇)

    自动驾驶决策 AI 的研究离不开仿真软件,一方面因为自动驾驶的实车测试需要在保证安全的环境中,这使得采用 AI 模型的实验难以开展;另一方面,对大部分研究者来说,实车测试的条件复杂且昂贵,难以满足。 同时,不论是以模仿学习为代表的监督学习算法,还是需要与环...
    赞 3
    评论
    浏览 5856
    实用工具
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-12 15:31:42

    import rl_utils 中的rl_utils要怎么安装?

    请问 rl_utils 使用什么命令安装,我怎么安装不上
    赞 1
    评论 4
    浏览 2646
    实用工具
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-12 15:43:29

    gym中环境的step应该怎么看? CartPole 环境中怎么查看状态定义和交互过程?

    大佬们想请问应该怎么查看 gym 中的环境
    赞
    评论 1
    浏览 1153
    实用工具
  • Atongmu
    Atongmu Atongmu Let's play games, shall we?
    发布于2021-10-11 20:30:20

    ~~~求助帖!引擎可视化~~~

    关于 Render 最近在学习写引擎的 render,现在用的 pygame,但是感觉很局限,也不好看。 求助大佬们,有没有啥推荐?感谢!!!
    赞 1
    评论
    浏览 1061
    实用工具
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-11 14:58:52

    gym没有FrozenLake-v0这个环境 是版本的问题吗?

    想请教一下大佬
    赞 1
    评论 3
    浏览 2333
    实用工具
  • AINova
    AINova AINova 研究强化学习,时空众包
    发布于2021-10-11 09:54:39
    OpenAI的https://spinningup.openai.com/en/latest/index.html
    赞
    评论
    浏览 1055
    实用工具
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2021-09-23 22:07:01

    推荐宝藏框架-jidiAI-github

    发现宝藏!jidi-ai 提供的 code 很全,包括强化学习常用的算法 AC, DDPG, DQN, MADDPG, PG, PPO, SAC, SARSA, table-Q 等等!还有接上了许多环境供大家当 baseline 使用! 附带链接:http...
    赞 17
    评论 4
    浏览 2429
    实用工具
  • 及第
    及第 及第 中科院自动化所研发的多智能体开源开放平台,欢迎访问www.jidiai.cn。
    发布于2021-09-27 10:31:46

    欢迎各位老师使用及第擂台布置课程大作业

    @toc 及第平台介绍 及第平台(www.jidiai.cn)是中科院自动化所研发的一个在线智能体算法博弈平台,主要功能有: 金榜:提供各游戏环境的排行榜以及总排行榜; 科目:提供丰富的游戏环境(目前 44 种); 秘籍:提供各种经典算法介绍和开源代码...
    赞 10
    评论
    浏览 2103
    实用工具
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    895
  • R
    Rlxia

    0 帖子 • 0 评论

    564
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链