RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
kevinliu
这家伙很懒,什么都没留下
个人成就
积分
1
帖子
1
评论
0
注册排名
2992
关注了
0
关注者
0
帖子
文章
kevinliu
这家伙很懒,什么都没留下
发布于3天前
清华团队提出RL专用神经网络优化器,性能位居榜首
在人工智能领域,强化学习(RL)一直被视为解决复杂序列决策问题的有力工具。这项技术不仅在电子游戏、棋类智能、机器人控制、自动驾驶等前沿领域大放异彩,还在大语言模型(LLM)的微调、对齐、推理等关键阶段发挥着重要作用。 然而,在深度神经网络作为函数近似器的背...
赞
2
评论
浏览
121
论文研讨
到底啦