发布于2025-06-25 15:59:22
京东探索研究院-强化学习-博士实习生 可转正-北京-HC 充足,长期有效
【工作职责】: LLM Post Training,万卡计算资源,GPU 充足; RL 训练框架搭建; LLM RL 训练理论研究; 强化学习前沿理论研究 (Hierarchical RL, Offline RL, Maximum-entropy RL) ...赞
评论
浏览
179