神经网络优化器 - 话题 | RLChina 强化学习社区

kevinliu 这家伙很懒，什么都没留下

发布于2024-12-18 11:23:24

清华团队提出RL专用神经网络优化器，性能位居榜首
在人工智能领域，强化学习（RL）一直被视为解决复杂序列决策问题的有力工具。这项技术不仅在电子游戏、棋类智能、机器人控制、自动驾驶等前沿领域大放异彩，还在大语言模型（LLM）的微调、对齐、推理等关键阶段发挥着重要作用。然而，在深度神经网络作为函数近似器的背...

赞 4

评论

浏览 1540

论文研讨
kevinliu 这家伙很懒，什么都没留下

发布于2025-03-03 17:10:22

神经网络优化器进化论：从SGD到RAD，读懂AI训练的内功心法
当 ChatGPT-o3 以近乎博士生水平解答各类难题，当 DeepSeek-R1 在复杂推理任务中超越顶尖工程师，我们惊叹于大模型“智能涌现”的奇迹，然而鲜有人意识到：这些拥有千亿参数的“数字大脑”，本质上是从初始混沌状态，通过数万小时的反复训练渐渐成形...

赞 4

评论 1

浏览 1140

经验分享

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132