RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • pan95732
    pan95732 pan95732 pan95732
    发布于2023-12-06 15:28:50

    有会汇编大佬吗?

    线上英文做题兼职,只要你日常专业的核心课程掌握的扎实, 有空闲时间,那么这个兼职就非常适合你。 时薪:200-300/h,200-800/次(根据专业及难度而上下浮动) 招聘要求: 1.国内 985/211/qs 前 300 院校本科大三以上在读或毕业。 ...
    赞 1
    评论 3
    浏览 1021
    招生招聘
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-06-25 09:53:16

    招聘网上辅导老师

    薪资:一单 200-800 不等(能力越强,报酬越高) 要求: 1.国内 985/211 院校在读或毕业,或者国外前 200 的院校 2.四六级 500+/雅思 6.5+/托福 90+ 符合以上信息并且感兴趣的朋友可以添加微信详聊:XJN09888 招聘信...
    赞 1
    评论 3
    浏览 138
    招生招聘
  • 刘
    刘 刘金毅 这家伙很懒,什么都没留下
    发布于3天前

    RLChina 论文研讨会第126期(2025.8.5直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 126 期论文研讨会将由天津大学博士生刘金毅主持,天津大学硕士生梁靖、天津大学硕士生寇龙馨、天津大学博士生李鹏翼为大...
    赞
    评论
    浏览 80
    论文研讨
  • pan95732
    pan95732 pan95732 pan95732
    发布于5天前

    兼职辅导老师

    【工作内容】主要是解答本科学术方面的问题,辅导题目答疑 兼职职位 ,不坐班,等待公司分配任务,时间自由 【薪资】200-1000/次 时薪 200 起 【要求】国内 985/211 院校在读或毕业,或者国外前 300 的院校 英语水平:四六级 500+/雅...
    赞
    评论
    浏览 85
    水区
  • G
    G Guan_zh 这家伙很懒,什么都没留下
    发布于6天前

    RLChina 论文研讨会第125期(2025.07.29直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 125 期论文研讨会将由上海科技大学硕士生管振翰主持,天津大学博士生张静为大家分享最新的研究工作,欢迎大家参与。 互...
    赞
    评论
    浏览 82
    论文研讨
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-07-03 10:43:38

    找线上辅导老师

    根据要求完成操作系统相关题目,也就是用英文做题, 只要你日常专业的核心课程掌握的扎实,有空闲时间那么这个线上做题就非常适合你 薪资:一单 200-800 不等(能力越强,报酬越高) 要求: 1.国内 985/211 院校在读或毕业,或者国外前 200 的院...
    赞
    评论 4
    浏览 140
    水区
  • M
    M multi-AUV 这家伙很懒,什么都没留下
    发布于8天前

    随机种子设置

    请问训练强化学习算法和测试强化学习算法时,随机种子应该如何设置?(1)训练算法时需要固定随机种子吗?(2)测试算法时需要固定随机种子吗?(3)如果固定随机种子,训练和测试的随机种子值相同吗?(4)为什么虽然在代码中设置了随机种子,但每次运行得到的结果还是不...
    赞
    评论
    浏览 40
    经验分享
  • 戴扬
    戴扬 戴扬 = 。=
    发布于12天前

    RLChina 论文研讨会第124期(2025.07.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 124 期论文研讨会将由国防科技大学系统工程学院博士生戴扬主持,国防科技大学理学院王琦副教授为大家分享最新的研究工作...
    赞
    评论
    浏览 140
    论文研讨
  • Michael
    Michael Michael 字节跳动招聘HR(不是猎头)
    发布于12天前

    字节跳动-AI Coding方向-招聘大模型算法工程师、算法专家

    # 字节跳动-AI Coding 方向-招聘大模型算法工程师、算法专家 字节跳动 AI Coding Agent 的方向,招聘大模型算法工程师、大模型算法专家、大模型算法团队 leader。 工作地点:北京、上海、杭州、深圳; 感兴趣的同学可以直接联系我,...
    赞
    评论
    浏览 674
    招生招聘
  • pan95732
    pan95732 pan95732 pan95732
    发布于2025-03-28 15:20:07

    找线上辅导老师(pyspark、爬虫、数据库...)

    根据要求完成操作系统相关题目,也就是用英文做题, 只要你日常专业的核心课程掌握的扎实,有空闲时间那么这个线上做题就非常适合你 pyspark、爬虫、数据库、Docker、安卓、汇编、并行计算、数电逻辑、 VHDL、fpga、APP 设计、电路设计、3D 建...
    赞
    评论 2
    浏览 366
    学术活动
  • Felicia
    Felicia Felicia 具身智能+大模型 创业公司HR, 前AI资深猎头,有7年招聘经验 微信:490618139 我司招聘强化学习+运动控制、多模态大模型等等人才
    发布于18天前
    大家好,我是具身智能创业公司的HR Felicia,我司聚焦于“通用具身大模型”的研发,是国内最早实现端到端统一具身大模型的公司,过去一年融资7轮。公司非常重视研发,博士占比高,做事风格比较低调踏实,很早就搭建了自己的数采团队,用真实数据去训练算法。 我们在寻找强化学习运用在运动控制方面的优秀人才或者强化学习运用在大模型训练方向,实习或者全职都可以,从实习生到资深工程师我们都在招,最好是硕士或以上学历,地点在深圳。感兴趣的同学可以直接联系我,微信:490618139 可参考职位描述: 运动控制-RL 职位描述 负责机器人领域的强化学习算法研究与开发,包括机械臂、灵巧手、机器人全身运动控制等核心技能训练; 熟悉机器人端到端操作模型,研究强化学习在ACT、Diffusion Policy、OpenVLA等前沿VLA模型中的应用; 基于Isaac Gym/Sim/Lab、MuJoCo等仿真平台,设计并实现机器人操作策略的强化学习训练框架,解决sim2real迁移问题; 研究操作模型基于人类或者模型反馈的真机强化学习,提升模型的泛化性和精准性,进一步提升模型的能力; 研究并开发模仿学习与强化学习相结合的算法,实现机器人复杂操作技能的快速学习和泛化; 负责强化学习模型的蒸馏、优化和真机部署,确保算法在实际机器人系统中的稳定运行; 跟踪机器人强化学习领域最新研究进展,推动算法创新和技术突破。 职位要求 具有计算机视觉、人工智能、机器人学、控制工程等相关专业背景,硕士及以上学历; 熟练掌握主流深度学习框架,如PyTorch、TensorFlow、JAX,并具备优秀的编程能力; 具备扎实的强化学习理论基础,熟悉PPO、SAC、TD3、DDPG等主流强化学习算法,有相关项目实践经验; 有Isaac Gym/Sim/Lab、MuJoCo等机器人仿真平台使用经验,具备sim2real项目开发经验; 了解机器人运动学、动力学建模,熟悉机器人操作(manipulation)或运动控制相关技术; 了解机器人端到端操作模型(如ACT、Diffusion Policy、OpenVLA、π0等)及大模型在机器人领域的应用; 有机械臂+灵巧手或足式机器人的强化学习/模仿学习项目经验者优先; 具备分布式训练经验,能够处理大规模数据和模型训练,有过强化学习系统框架开发者优先; 机器人学习、强化学习相关顶级会议论文发表经历或相关比赛获奖经历者优先考虑; 具有技术热情、技术信仰以及较强的学习能力和问题解决能力。
    赞
    评论
    浏览 531
    水区
  • Felicia
    Felicia Felicia 具身智能+大模型 创业公司HR, 前AI资深猎头,有7年招聘经验 微信:490618139 我司招聘强化学习+运动控制、多模态大模型等等人才
    发布于18天前

    具身智能明星创业公司-强化学习招人-实习/全职都可-深圳

    大家好,我是具身智能创业公司的 HR Felicia,我司聚焦于“通用具身大模型”的研发,是国内最早实现端到端统一具身大模型的公司,过去一年融资 7 轮。公司非常重视研发,博士占比高,做事风格比较低调踏实,很早就搭建了自己的数采团队,用真实数据去训练算法。...
    赞
    评论
    浏览 302
    水区
  • 王
    王 王梓岩 这家伙很懒,什么都没留下
    发布于18天前

    RLChina 论文研讨会第123期(2025.7.15直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 123 期论文研讨会将由伦敦国王学院博士生王梓岩主持,卡内基梅隆大学 张志成, 吉林大学 郭思源,为大家分享最新的研...
    赞
    评论
    浏览 155
    论文研讨
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于23天前

    大模型社会模拟新突破:中科院团队提出MF-LLM框架,实现动态群体行为高保真模拟

    本文第一作者 米祈睿 ,中科院自动化所博士生(导师:汪军、张海峰老师),现于南洋理工大学安波教授团队访问,研究方向为群体智能体决策(LLM/RL)及基于智能体的经济仿真。 1. 大模型社会模拟的机遇与挑战 随着大语言模型(LLM)技术的快速发展,社会模拟研...
    赞 3
    评论
    浏览 1664
    论文研讨
  • C
    C castor_v_pollux 这家伙很懒,什么都没留下
    发布于26天前

    RLChina 论文研讨会第122期(2025.7.8直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 122 期论文研讨会将由北京大学博士生鲁云龙主持,北京大学博士生马允轩为大家分享最新的研究工作,欢迎大家参与。 互动...
    赞
    评论
    浏览 163
    论文研讨
  • S
    S spacegoing 这家伙很懒,什么都没留下
    发布于2025-06-25 15:59:22

    京东探索研究院-强化学习-博士实习生 可转正-北京-HC 充足,长期有效

    【工作职责】: LLM Post Training,万卡计算资源,GPU 充足; RL 训练框架搭建; LLM RL 训练理论研究; 强化学习前沿理论研究 (Hierarchical RL, Offline RL, Maximum-entropy RL) ...
    赞
    评论
    浏览 188
    招生招聘
  • 汤
    汤 汤楠-NJU 这家伙很懒,什么都没留下
    发布于2025-06-19 11:20:52

    RLChina 论文研讨会第121期 (2025.6.24直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 121 期论文研讨会将由南京大学博士生汤楠主持,南京大学硕士生王一迪、南京大学本科生杨博涵为大家分享最新的研究工作,...
    赞
    评论 1
    浏览 287
    论文研讨
  • S
    S spacegoing 这家伙很懒,什么都没留下
    发布于2025-06-19 18:03:56

    京东探索研究院-强化学习-博士实习生 可转正-北京-HC 充足,长期有效

    【工作职责】: LLM Post Training,万卡计算资源,GPU 充足; RL 训练框架搭建; LLM RL 训练理论研究; 强化学习前沿理论研究 (Hierarchical RL, Offline RL, Maximum-entropy RL) ...
    赞
    评论
    浏览 227
    招生招聘
  • 薛
    薛 薛正海-NTU 这家伙很懒,什么都没留下
    发布于2025-06-16 23:48:56

    RLChina 论文研讨会第120期 (2025.6.17直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 120 期论文研讨会将由新加坡南洋理工大学博士生俸朗为大家分享最新的研究工作,欢迎大家参与。 互动方式:在本帖留言,...
    赞
    评论
    浏览 309
    论文研讨
  • S
    S Selena 这家伙很懒,什么都没留下
    发布于2025-06-12 15:53:46

    知名新势力汽车公司求RL算法的高阶

    知名新势力汽车公司在招 RL 算法的高阶 base 北京/上海 主要 for 端到端自动驾驶的业务 感兴趣的同学,可以加我微信 nanaliu1011, 简历可以发我邮箱:selenaliu88@outlook.com
    赞
    评论
    浏览 216
    水区
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    969
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • R
    Rlxia

    0 帖子 • 0 评论

    568
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链