RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • Heron_7
    Heron_7 Heron_7 这家伙很懒,什么都没留下
    发布于2025-04-01 20:11:32

    零编程基础入门RL求助(请教各位大佬

    各位大佬好,我是三年级在读电子信息工程专业本科生,由于之前没有想过转码也没有什么编程方面的课程,现在的代码功底比较差。但是 Py 的基础语法我都学过一遍,但是感觉写的都不是很精。尤其是类和对象那一块,在看张伟楠老师的动手学 RL 那本书的时候发现自己可以懂...
    赞
    评论 19
    浏览 953
    课程学习
  • J
    J jx 这家伙很懒,什么都没留下
    发布于8天前

    博士后招募

    🚀 博后招募 & 实习生招幕 | 自动驾驶 清华大学李克强院士团队、李升波教授课题组面向自动驾驶方向,正在寻找合适的博士后加入,也欢迎一些研究生以实习生、联培的形式参与。 主要需求: 🔹 自动驾驶环境感知、建图方向 🔹 自动驾驶/计算机视觉 我们希望: 🎓...
    赞
    评论
    浏览 82
    招生招聘
  • 清木
    清木 清木 safe learning
    发布于9天前

    Agentic AI Frontier Seminar 全球线上系列研讨会正式启动

    我们非常高兴地宣布,Agentic AI Frontier Seminar 即将开启!此次系列研讨会旨在汇聚全球领先的学者与产业专家,探讨智能体(AI Agents)的最新进展与未来方向。 本系列研讨会围绕三大核心主题: 推理与规划(Reasoning ...
    赞
    评论
    浏览 364
    学术活动
  • 赵祉瑜+中科院自动化所
    赵祉瑜+中科院自动化所 赵祉瑜+中科院自动化所 本科北京理工大学,中科院自动化所硕士
    发布于2024-07-11 00:59:03

    前沿追踪 | 强化学习月度十大动态 2406 期:佐治亚理工学院研究语言引导技能发现,通过GUI控制的DigiRL等

    导读 本推文整理了 2024 年 6 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞 2
    评论 1
    浏览 1069
    新闻动态
  • KRHKK
    KRHKK KRHKK 这家伙很懒,什么都没留下
    发布于16天前

    RLChina 论文研讨会第128期(2025.9.2直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 128 期论文研讨会将由中科院自动化研究所博士生崔新宇主持,清华大学博士生 陈华玉 和 西湖大学博士生 冯浩东 为...
    赞
    评论
    浏览 259
    论文研讨
  • J
    J jx 这家伙很懒,什么都没留下
    发布于22天前

    3DGS、自动驾驶感知、计算机视觉方向的博士后招聘

    清华大学车辆与运载学院智能驾驶课题组,寻找合适的博士后加入,未来有计划在自动驾驶、具身机器人领域工作的欢迎交流。 需求方向: 3D Gaussian Splatting 动静场景重建 动静场景组合编辑形成新场景 自动驾驶感知/计算机视觉 我们希望: 科研方...
    赞
    评论
    浏览 152
    水区
  • Z
    Z Zhengbang Zhu 这家伙很懒,什么都没留下
    发布于22天前

    RLChina 论文研讨会第127期(2025.8.26直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 127 期论文研讨会将由上海交通大学博士生竺正邦主持,阿德莱德大学博士生张文博和上海交通大学硕士生谢炜基为大家分享最...
    赞
    评论
    浏览 241
    论文研讨
  • pan95732
    pan95732 pan95732 pan95732
    发布于22天前

    前端、web、可视化、C#…

    前端、Web、可视化、C#… 岗位要求: 1、英语有较好的阅读能力,四六级或雅思 6.5+ 或托福 90+; 2、985/211 院校本科大三以上,研究生、硕士等;(国内外应往届均可); 3、做事一定要认真负责有耐心,工作时间地点不限; V:pan9573...
    赞
    评论
    浏览 163
    课程学习
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-08-11 14:32:33

    找线上辅导老师

    现需要一下方面的老师: 机器学习、数据挖掘、计算机视觉、spark、Scala、Swift、安卓、算法、前端、汇编、nodejs、电气工程、机械、数据科学、数据分析、eviews、stata、R 语言、SAS、实证、生物统计、市场营销、国际贸易、项目管理、...
    赞
    评论 1
    浏览 154
    水区
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-03-28 15:20:07

    找线上辅导老师(pyspark、爬虫、数据库...)

    根据要求完成操作系统相关题目,也就是用英文做题, 只要你日常专业的核心课程掌握的扎实,有空闲时间那么这个线上做题就非常适合你 pyspark、爬虫、数据库、Docker、安卓、汇编、并行计算、数电逻辑、 VHDL、fpga、APP 设计、电路设计、3D 建...
    赞
    评论 3
    浏览 492
    学术活动
  • E
    E EGO 这家伙很懒,什么都没留下
    发布于2025-08-13 11:35:46

    大规模多路径多背包依赖问题怎么解?

    老师做课题,碰到一个类似于多路径、多背包依赖 的强化学习问题; 问题设定: 有 k 个物品(大约 5–8 个)。 存在多条 路径,每条路径上有自己的一组 背包。 各路径上的物品规格相同。 背包数量范围:小规模约 30 个,大规模可达 1000 个。 路径数...
    赞
    评论
    浏览 189
    水区
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-07-28 08:45:50

    兼职辅导老师

    【工作内容】主要是解答本科学术方面的问题,辅导题目答疑 兼职职位 ,不坐班,等待公司分配任务,时间自由 【薪资】200-1000/次 时薪 200 起 【要求】国内 985/211 院校在读或毕业,或者国外前 300 的院校 英语水平:四六级 500+/雅...
    赞
    评论 1
    浏览 227
    水区
  • pan95732
    pan95732 pan95732 pan95732
    发布于2023-12-06 15:28:50

    有会汇编大佬吗?

    线上英文做题兼职,只要你日常专业的核心课程掌握的扎实, 有空闲时间,那么这个兼职就非常适合你。 时薪:200-300/h,200-800/次(根据专业及难度而上下浮动) 招聘要求: 1.国内 985/211/qs 前 300 院校本科大三以上在读或毕业。 ...
    赞 1
    评论 3
    浏览 1139
    招生招聘
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-06-25 09:53:16

    招聘网上辅导老师

    薪资:一单 200-800 不等(能力越强,报酬越高) 要求: 1.国内 985/211 院校在读或毕业,或者国外前 200 的院校 2.四六级 500+/雅思 6.5+/托福 90+ 符合以上信息并且感兴趣的朋友可以添加微信详聊:XJN09888 招聘信...
    赞 1
    评论 3
    浏览 257
    招生招聘
  • 刘
    刘 刘金毅 这家伙很懒,什么都没留下
    发布于2025-07-30 16:16:23

    RLChina 论文研讨会第126期(2025.8.5直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 126 期论文研讨会将由天津大学博士生刘金毅主持,天津大学硕士生梁靖、天津大学硕士生寇龙馨、天津大学博士生李鹏翼为大...
    赞
    评论
    浏览 291
    论文研讨
  • G
    G Guan_zh 这家伙很懒,什么都没留下
    发布于2025-07-27 21:26:47

    RLChina 论文研讨会第125期(2025.07.29直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 125 期论文研讨会将由上海科技大学硕士生管振翰主持,天津大学博士生张静为大家分享最新的研究工作,欢迎大家参与。 互...
    赞
    评论
    浏览 232
    论文研讨
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-07-03 10:43:38

    找线上辅导老师

    根据要求完成操作系统相关题目,也就是用英文做题, 只要你日常专业的核心课程掌握的扎实,有空闲时间那么这个线上做题就非常适合你 薪资:一单 200-800 不等(能力越强,报酬越高) 要求: 1.国内 985/211 院校在读或毕业,或者国外前 200 的院...
    赞
    评论 4
    浏览 252
    水区
  • M
    M multi-AUV 这家伙很懒,什么都没留下
    发布于2025-07-25 16:35:29

    随机种子设置

    请问训练强化学习算法和测试强化学习算法时,随机种子应该如何设置?(1)训练算法时需要固定随机种子吗?(2)测试算法时需要固定随机种子吗?(3)如果固定随机种子,训练和测试的随机种子值相同吗?(4)为什么虽然在代码中设置了随机种子,但每次运行得到的结果还是不...
    赞
    评论
    浏览 149
    经验分享
  • 戴扬
    戴扬 戴扬 = 。=
    发布于2025-07-21 19:03:42

    RLChina 论文研讨会第124期(2025.07.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 124 期论文研讨会将由国防科技大学系统工程学院博士生戴扬主持,国防科技大学理学院王琦副教授为大家分享最新的研究工作...
    赞
    评论
    浏览 281
    论文研讨
  • Michael
    Michael Michael 字节跳动招聘HR(不是猎头)
    发布于2025-07-21 14:17:42

    字节跳动-AI Coding方向-招聘大模型算法工程师、算法专家

    # 字节跳动-AI Coding 方向-招聘大模型算法工程师、算法专家 字节跳动 AI Coding Agent 的方向,招聘大模型算法工程师、大模型算法专家、大模型算法团队 leader。 工作地点:北京、上海、杭州、深圳; 感兴趣的同学可以直接联系我,...
    赞
    评论
    浏览 864
    招生招聘
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2025 大会(注册报名中):http://rlchina.org/rlchina_2025

三、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

四、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛:http://rlchina.org/topic/928

八、RLChina 前沿讲习班:http://rlchina.org/topic/215

九、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    1009
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • R
    Rlxia

    0 帖子 • 0 评论

    568
  • RLChina
    RLChina

    124 帖子 • 77 评论

    455
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链