AI - 话题 | RLChina 强化学习社区

博文视点Broadview 博文视点，IT出版旗舰品牌，关注人工智能领域前沿技术与深度应用，出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧！让我们一起来抢占人工智能至高点！

发布于2021-11-09 14:23:40

如何在AI工程实践中选择合适的算法？
在使用深度强化学习（Deep Reinforcement Learning，DRL）算法解决实际问题的过程中，明确任务需求并初步完成问题定义后，就可以为相关任务选择合适的 DRL 算法了。以 DeepMind 的里程碑工作 AlphaGo 为起点，每年各...

赞 1

评论

浏览 1513

水区
博文视点Broadview 博文视点，IT出版旗舰品牌，关注人工智能领域前沿技术与深度应用，出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧！让我们一起来抢占人工智能至高点！

发布于2021-11-30 10:12:28

瞥一瞥AI，撩一撩算法
本文转自【吕磊】风和日丽的午后，你走在马路上。一个人型机器人迎面走来，点头，微笑，挥手，和你擦肩而过。你回头望去，街头绿灯下，机器人正小跑穿过人行横道，步伐轻盈，体态自然。机器人渐行渐远…… 你停下脚步，浮想联翩。“我和它究竟有何分别？” “不，那...

赞

评论

浏览 1479

水区
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-05-05 11:00:37

ICML 2023 | 数研院提出决策大模型经验回放系统GEAR，较DeepMind Reverb数据吞吐量最高提升至六倍！
近日，上海数字大脑研究院（简称“数研院”）提出分布式经验回放系统 GEAR（又名 PipeDT），优化了现代 GPU 系统在数据储存、并行计算和高速通信的软硬件特性，更适用于 RL 大模型的经验回放过程。该项论文成果已被机器学习顶会 ICML2023 收录...

赞

评论

浏览 1347

论文研讨
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-05-09 19:13:30

FCS 2023｜数研院发表面向序贯决策任务的大模型算法综述
（部分内容由谜题科技的决策大模型“Enigma”撰写）近日，上海数字大脑研究院（简称“数研院”）联合中英高校团队对于使用 Transformer 模型解决序贯决策任务的研究提供了全面的综述，为建立大型决策大模型提供了一系列潜在的研究方向。该论文已被 S...

赞

评论

浏览 2001

论文研讨
Jane 量化从业8年+/求贤若渴/不设阈值 wechat：Tangle_2013

发布于2025-03-31 13:24:36
各位玩家：九坤第八届量化联赛第一期 | UbiPoker AI赛开启报名！【赛题简介】本期比赛中，我们将带领大家挑战经典AI赛事，体验Poker AI对抗的魅力【技能挑战】（1）本期比赛将着重考察参赛者：AI设计能力，概率分析能力，实际问题解决能力（2）选手需要以我们提供的程序平台为基础，可基于规则利用机器学习等方法，用自己擅长的策略开发一套AI程序，这些AI会在我们提供的平台上进行随机对抗，期待各位的表现。【赛事激励】 Ubiquant opportunities：赛事专属面试直通卡 Ubiquant gifts：丰厚赛事奖金和奖品 Ubiquant challenge：硬核量化技术挑战 Ubiquant Conection：量化沙龙分享本期奖项设置冠军团队：50,000 元现金及荣誉证书每位选手可获得新款iPad Air11英寸亚军团队：30,000 元现金及荣誉证书每位选手可获得 Apple Watch Series 10 季军团队：10,000 元现金及荣誉证书每位选手可获得富士mini Liplay拍立得 UbiPoker特色队伍奖 - 5,000 元现金及荣誉证书 - SLOWPLAY Poker陶瓷筹码套装点击下方链接立即报名，开启你的量化之旅。比赛详情：https://mp.weixin.qq.com/s/ONfS_HNqX_jtvyFySQQ4sw
赞

评论

浏览 1203

学科竞赛
Jane 量化从业8年+/求贤若渴/不设阈值 wechat：Tangle_2013

发布于2025-10-22 15:21:49

各位玩家：九坤量化联赛第三期“极限Code双赛季”倒计时报名6天！九坤今年最后一期量化赛题形式升级： “ACM 预赛 + AI挑战赛总决赛” ，挑战Code极限！ 📍赛事赛程介绍预赛赛题简介第一轮：预赛 | Accepted极限代码巅峰赛本期赛题由 NOI 金牌 + IOI 金牌选手联合命题，旨在挑战实力与速度的极限。采用经典的ACM赛制，参赛者需以2人团队形式，在3个小时内解决7个有挑战性的题目。实时评测，解题数目多者排名靠前。若存在多团队解题数一样，罚时低者靠前。预赛排名前25名的队伍晋级决赛！决赛赛题简介第二轮：决赛 | 坤星保卫战入围决赛方式：预赛排名前25名的队伍决赛赛题介绍：坤星上的堡垒正在遭受不明怪物的袭击，需要你利用手上的资源，尽全力击退坤星上的不明怪物。怪物沿着折线地图从起点走向终点，玩家需要在地图上布置防御塔，抵抗尽可能多轮次的怪物进攻。 ➡玩家获得信息：在每一轮游戏开始前，玩家会得到该轮游戏的地图坐标信息，以及怪物信息和可用的防御塔信息，其中部分关键信息将以文本描述的形式给出。 ➡玩家采取行动：玩家需要设计模型以理解获得的文本内容，然后在有限的成本下购买防御塔，并在地图上排兵布阵，抵抗逐渐变强的怪物。赛事考察技能：大语言模型的文本理解、推理、规划能力。 📍赛事奖励详情预赛： 1) 前50名团队获得伴手礼：九坤定制棒球帽+九坤定制T-恤 2）Ubi-Accepted 代码王者奖（前三个队伍）：任天堂游戏机决赛： 1）冠军团队：50,000元现金、荣誉证书、每位选手可获得大疆Osmo 360 畅拍套 2）亚军团队：30,000元现金、荣誉证书、每位选手可获得富士拍立得 WIDE Evo 3）季军团队：10,000元现金、荣誉证书、每位选手可获得苹果AirPods pro3 4）特色队伍：5,000元现金、荣誉证书、每位选手可获得罗技G913TKL无线机械键盘 *以上奖品支持等价自定义入围决赛团队均获得阳光普照：九坤限量版礼包 📍赛事日程报名截止：2025.10.27 18:00 预赛阶段：10月28日（周二）晚19:00——22:00 入围公布：10月30日（周四）公测阶段：10月30-11月16日（周日）线下决赛：11月29日（周六）全天比赛详情：https://mp.weixin.qq.com/s/FQXrPKm1eY0SGNGM4oLC4A 点击参赛：https://competition.nowcoder.com/220/introduce#403

赞 2

评论

浏览 1001

学科竞赛
Jane 量化从业8年+/求贤若渴/不设阈值 wechat：Tangle_2013

发布于2026-03-26 16:21:37

九坤第九届量化联赛“AI推理挑战赛” 开启报名！
【赛题简介】本次比赛平台为神谕解读所的任务大厅，每个解读者团队都拥有有限的 GPU 推理资源，参赛者需设计自己的接单系统，在动态变化的任务流中做出实时决策：是否接单、如何执行、如何调度、如何分配资源，在统一的资源约束下，最大化自己团队的总收益。【技能挑...

赞

评论

浏览 749

学科竞赛

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132