产业应用 - 话题 | RLChina 强化学习社区

古月这家伙很懒，什么都没留下

发布于2024-05-15 23:27:40

强化学习在自动驾驶路径规划任务
新手小白，想要开始在路径规划上试用强化学习，有没有有经验的大佬尝试过，这样的训练是不是需要很强的算力支撑啊？有没有比较靠谱的时长和显卡标准？

赞 1

评论

浏览 1034

产业应用
张知临这家伙很懒，什么都没留下

发布于2024-01-10 13:13:58

强化学习在广告自动出价场景的大规模落地实践
导读：本文整理自在 RL-China 的分享实录，欢迎阅读交流。 1. 前言在线广告对于大多数同学来说是一个既熟悉又陌生的技术领域。「搜广推」、「搜推广」等各种组合耳熟能详，但广告和搜索推荐有本质区别：广告解决的是“媒体-广告平台-广告主”等多方优化问题...

赞 2

评论

浏览 3858

产业应用
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-04-07 15:39:27

数字大脑研究院院长、谜题科技首席科学家汪军出席“2023上海全球投资促进大会”，并与临港集团正式签约
2023 上海全球投资促进大会于昨日（4 月 6 日）上午在世博中心举行，向全球发出上海邀约，共享发展机遇、共商合作大计、共创美好未来。市委书记陈吉宁出席并致辞。市委副书记、市长龚正宣读 2023 上海全球招商合作伙伴名单。市委常委、常务副市长吴清作“投资...

赞

评论

浏览 1337

产业应用
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-06 14:49:12

UCL汪军呼吁创新：后ChatGPT通用人工智能理论及其应用
本文原载于“机器之心”公众号，由 UCL 教授、上海数字大脑研究院院长汪军撰写，他呼吁我们不仅要复制 ChatGPT 的成功，更重要的是在以下人工智能领域推动开创性研究和新的应用开发。 *本文原为英文写作，中文由 ChatGPT 翻译完成，原貌呈现，少数歧...

赞 1

评论

浏览 2038

产业应用
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业，核心技术是通过推演亿万种决策的不同结果，找到通向未来的最优路径，实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启，开创性地提出数据驱动的虚拟环境构建技术，从少量历史交互数据中构建虚拟世界，寻找最优决策，避免在线试错的代价。

发布于2023-02-07 11:53:45

极限汽车运动控制全矢量协同控制技术
极限汽车运动控制汽车作为拥有数千部件的复杂系统，长久以来，通过不同模块之间的互相制衡与协同，在固化的功能中找到折衷方案，保证变化路况下人们的驾驶安全。未来的智能化车辆控制，不但要求在极端状况下保持车身的稳定性，如高速爆胎和动态附着路面下的驾乘安全，同时...

赞

评论

浏览 1445

产业应用
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2022-11-30 16:27:27

产业速递｜数字世界里的足球——数研院探索多智能体足球AI并取得新突破
世界杯终于回来了，经历了疫情的三年时光，全世界的球迷都尤其期盼着这个也许是人类历史上意义仅次于 1948 年伦敦奥运会的盛大赛事——2022 卡塔尔世界杯。 1863 年，英国足球协会在伦敦正式成立，标志着真正意义上的现代足球诞生了。在这一百多年的发展中，...

赞 1

评论 1

浏览 2988

产业应用
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业，核心技术是通过推演亿万种决策的不同结果，找到通向未来的最优路径，实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启，开创性地提出数据驱动的虚拟环境构建技术，从少量历史交互数据中构建虚拟世界，寻找最优决策，避免在线试错的代价。

发布于2022-11-04 19:35:38

强化学习工业软件&预训练模型｜南栖仙策最新发布
摘要： 11 月 3 日南栖仙策通用智能决策 2022 发布会，介绍了强化学习工业软件 REVIVE 的最新版本，更为惊艳的是，发布了首个工业控制预训练模型。可以预见到，强化学习，这一曾经在围棋上战胜人类的 AI 技术，将为工业场景带来巨大变革。点击南栖...

赞 5

评论

浏览 1779

产业应用
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2022-10-27 19:02:33

【峰会活动】决策智能产业化论坛内容回顾
近期，DataFun 与上海数字大脑研究院联合举办了决策智能在线峰会，邀请决策智能领域学术与产业专家共话技术与产业。上海数字大脑研究院出品了以「决策智能产业化」为主题的在线论坛，上海数字大脑研究院执行 CEO、CMC Capital VP 刘海涛担任论坛出...

赞

评论

浏览 1165

产业应用
OpenDILab决策智能聚焦科技前沿研究问题，致力于探索下一代人工智能

发布于2022-09-26 14:45:18

万事开头难？喵小DI玩“羊了个羊”可不难
Hello，大家好呀，喵小 DI 又来了～最近大家是不是都在玩《羊了个羊》？喵小 DI 也尝试了下，本来想着凭借本喵超高的智商，过第二关简直易如反掌，结果还是，惨败：( 喵小 DI 又尝试了 N+1 下，本来想着再凭借本喵超高的智商，过第二关还不易...

赞 2

评论

浏览 1912

产业应用
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2022-09-01 18:37:11

数研院首次发布《2022上半年度人工智能行业报告》，多层面深度分析全球AI发展
随着科技进步和产业变革的加速演进，人工智能技术已成为各国必争的科技创新高地。放眼全球，在机构、产业、政府等各个层面，人工智能都受到高度重视，被认为是新基建的重要支撑，可以带来“新基遇”。得益于此，其在学术研究、产业技术创新等方面都呈现出全新的发展态势。近...

赞 1

评论

浏览 1420

产业应用
OpenDILab决策智能聚焦科技前沿研究问题，致力于探索下一代人工智能

发布于2022-08-09 21:58:07

OpenDILab提出InterFuser自动驾驶策略，凭借超强性能获居CARLA Leaderboard首位
介绍一下 OpenDILab 团队最新提出的自动驾驶策略 InterFuser(Interpretable Sensor Fusion Transformer)。该策略基于 Transformer 进行多传感器融合的和使用可解释性特征增加自动驾驶的安全性，...

赞 2

评论

浏览 2020

产业应用
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业，核心技术是通过推演亿万种决策的不同结果，找到通向未来的最优路径，实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启，开创性地提出数据驱动的虚拟环境构建技术，从少量历史交互数据中构建虚拟世界，寻找最优决策，避免在线试错的代价。

发布于2022-08-09 16:47:02

「仙启教学视频」REVIVE SDK 行业应用——大滞后控制案例，使用数据驱动强化学习（离线强化学习）开发工具包，解决行业问题
「仙启」REVIVE SDK 行业应用，控制系列教程，结合工业控中大滞后控制案例展示如何使用 REVIVE 工具去解决工业控制中这一问题，教学视频已发布，欢迎小伙伴们查阅。视频观看，详见南栖仙策 B 站： REVIVE SDK 行业应用大滞后控制案例【...

赞

评论

浏览 1585

产业应用
OpenDILab决策智能聚焦科技前沿研究问题，致力于探索下一代人工智能

发布于2022-06-28 17:08:01

解决这两个世界级难题，自动驾驶就能够实现超进化？
引言自动驾驶领域近几年来一直备受关注，但截止目前，自动驾驶在现实复杂场景下的大规模部署应用却一再延后。其中一个很重要的原因是，目前业界对于动态和强交互性场景下的行为、轨迹预测问题（behavior prediction）始终没有得出很好的解决方案。缺乏...

赞

评论

浏览 1437

产业应用
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业，核心技术是通过推演亿万种决策的不同结果，找到通向未来的最优路径，实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启，开创性地提出数据驱动的虚拟环境构建技术，从少量历史交互数据中构建虚拟世界，寻找最优决策，避免在线试错的代价。

发布于2021-12-16 18:14:41

NeoRL: 接近真实世界的离线强化学习基准
众所周知，强化学习（RL）在游戏界的成功已经在 AI 界产生了轰动，不管是玩出历史高分的微软 AI，还是继围棋之后，人工智能又攻克的德州扑克，亦或是利用“左右互搏”来增强学习的 OpenAI。人工智能在不同的游戏中的最新得分已经超越了人类的水平。当大家...

赞 2

评论

浏览 1983

产业应用
vinbo The whole life is a game...

发布于2021-11-12 14:01:52

大家收到这个AI项目合作邀请信了吗？
我在 b 站收到的你好我们是一个加密货币 NFT 方面的团队，现在想做一些和 AI 有关的 NFT 项目，就是以 AI 本身为 NFT 进行交易的一个 GAMEFI 项目，AI 角色通过训练后，作为 NFT 装备包本身，进行交易。但我们对 AI 这块有...

赞 4

评论 5

浏览 1658

产业应用
dandan 研二在读，边缘计算，强化学习加油冲啊

发布于2021-10-13 08:59:50

请问大佬，我的DDPG算法不收敛是什么原因？
DDPG 算法不收敛是我采样的数据随机性太大了吗

赞

评论 2

浏览 2413

产业应用
dandan 研二在读，边缘计算，强化学习加油冲啊

发布于2021-10-11 17:41:34

请问大佬FrozenLake中的FrozenLake-v1这个环境 “由于是冰面，每次行走有一定的概率滑行到附近的其它状态” 这句话应该怎么理解？
也就是说状态转移中在第 0 个状态下采取动作 0 后面跟的这三个四元组怎么理解？ 0(state): {0(action): [(0.3333333333333333, 0, 0.0, False), (0.3333333333333333, 0, 0...

赞

评论 2

浏览 1637

产业应用
Z

Z zhangmou266 这家伙很懒，什么都没留下

发布于2021-10-09 19:39:08

强化学习在机器人领域的应用
在人机交互的场景中，对于非常耗时的强化学习过程有什么替代人类参与机器人学习过程的应对策略吗？

赞 1

评论

浏览 1555

产业应用

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132