- 发布于2021-10-09 19:29:14
推荐强化学习绘图库rl-plotter
非常实用的强化学习绘图库,一行命令就能搞定强化学习算法的学习曲线,详见 Github 页面 更新了预览图片,欢迎大家点赞本贴和 star 支持~ rl-plotter This is a simple tool which can plot lear...赞 24评论 21浏览 4123 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2022-07-14 10:37:45
「仙启教学视频」基于VS Code的POLIXIR REVIVE SDK 开发,数据驱动强化学习(离线强化学习)开发工具包辅助插件
基于 VS Code 的 POLIXIR REVIVE SDK 开发,数据驱动强化学习(离线强化学习)开发工具包辅助插件教学视频已发布,欢迎小伙伴们查阅观看! 视频观看,详见南栖仙策 B 站:基于 VS Code 的 POLIXIR REVIVE SDK ...赞评论 5浏览 1036 - 发布于2022-08-31 10:00:58
开源贴!欢迎大家来戳!
我们开源了 TimeChamber https://github.com/inspirai/TimeChamber 一个基于 IsaacGym 大规模并行 Self-Play 框架,只需要 1 个 GPU 跑训练! 欢迎大家来戳!赞 4评论 1浏览 900 - 发布于2022-08-31 10:03:51
TimeChamber开源了!
我们开源了 TimeChamber https://github.com/inspirai/TimeChamber 一个基于 IsaacGym 大规模并行 Self-Play 框架,只需要 1 个 GPU 跑训练! 欢迎大家来戳!赞评论浏览 958 - 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。发布于2022-08-24 10:30:21
星际争霸II协作对抗基准超越SOTA,新型Transformer架构解决多智能体强化学习问题
“这项工作又让我们回到那个老生常谈的问题:Transformer 真的是万能的吗?” 多智能体强化学习 (MARL) 是一个具有挑战性的问题,它不仅需要识别每个智能体的策略改进方向,而且还需要将单个智能体的策略更新联合起来,以提高整体性能。最近,这一问题得...赞 4评论浏览 953 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2022-07-05 14:01:28
「仙启」REVIVE SDK下载与安装(基于Docker),数据驱动强化学习(离线强化学习)开发工具包
数据驱动强化学习(离线强化学习)开发工具包 REVIVE SDK 下载与安装(基于 Docker)的教学视频已发布,欢迎小伙伴们查阅观看! 视频观看,详见南栖仙策 B 站:REVIVE SDK 下载与安装(基于 Docker) 【POLIXIR REVIV...赞评论浏览 904 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2022-07-04 15:29:10
【REVIVE SDK版本更新】REVIVE SDK 0.7.2版正式发布
REVIVE SDK 0.7.2 版正式发布,欢迎小伙伴们下载使用。 1、REVIVE SDK 0.7.2 下载地址:REVIVE SDK 首页 2、REVIVE SDK 0.7.2 文档地址: REVIVE 帮助中心 3、REVIVE SDK 0.7....赞评论浏览 805 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2022-07-01 16:34:12
【REVIVE IDE发布】POLIXIR REVIVE For VS Code 1.0正式发布
POLIXIR REVIVE For VS Code 1.0 正式发布,欢迎小伙伴们下载试用。 1、POLIXIR REVIVE For VS Code 1.0 正式发布: https://marketplace.visualstudio.com/item...赞评论浏览 798 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2022-05-20 10:49:32
「仙启」REVIVE SDK快速入门系列教程,玩转数据驱动强化学习(离线强化学习)开发工具包
「仙启」REVIVE SDK 快速入门系列教程,结合冰箱温控案例展示如何使用 REVIVE 工具去完成自己的决策任务。 1、强化学习基础概念 2、使用尽可能少的数学公式和代码展示如何使用 REVIVE 工具去完成自己的决策任务 视频观看,详见南栖仙策 B ...赞 1评论浏览 983 - POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于2022-05-20 10:41:27
「仙启」REVIVE SDK下载与安装,数据驱动强化学习(离线强化学习)开发工具包
数据驱动强化学习(离线强化学习)开发工具包教学视频已发布,欢迎小伙伴们查阅观看! 视频观看,详见南栖仙策 B 站: https://www.bilibili.com/video/BV1iZ4y187Fs 【POLIXIR REVIVE SDK 简介】 南...赞 2评论浏览 900 - 发布于2022-05-16 18:48:02
混合动作空间|揭秘创造人工智能的黑魔法(1)
OpenDILab 新开设了混合动作空间专栏,将从离散动作空间和连续动作空间入手,为大家介绍混合动作空间的起源和发展,并解读一系列学术界相关 paper。 本文作为混合动作空间系列专题文章的第一篇,主要是介绍混合动作空间的类型以及经典环境。 近年来,强化学...赞 1评论浏览 1250 - 发布于2021-10-12 15:31:42赞 1评论 4浏览 2228
- 发布于2021-10-12 15:43:29赞评论 1浏览 1033
- 发布于2021-10-11 20:30:20赞 1评论浏览 956
- 发布于2021-10-11 14:58:52赞 1评论 3浏览 2168
- 发布于2021-10-11 09:54:39赞评论浏览 952
- 发布于2021-09-23 22:07:01
推荐宝藏框架-jidiAI-github
发现宝藏!jidi-ai 提供的 code 很全,包括强化学习常用的算法 AC, DDPG, DQN, MADDPG, PG, PPO, SAC, SARSA, table-Q 等等!还有接上了许多环境供大家当 baseline 使用! 附带链接:http...赞 17评论 4浏览 2268 - 发布于2021-09-27 10:31:46
欢迎各位老师使用及第擂台布置课程大作业
@toc 及第平台介绍 及第平台(www.jidiai.cn)是中科院自动化所研发的一个在线智能体算法博弈平台,主要功能有: 金榜:提供各游戏环境的排行榜以及总排行榜; 科目:提供丰富的游戏环境(目前 44 种); 秘籍:提供各种经典算法介绍和开源代码...赞 10评论浏览 1948