- 发布于2023-09-14 09:54:21
学霸们,无论你在职还是在读欢迎你的加入!
【介绍】 我们是一家专注于为大学生群体提供课后习题答疑的教育机构,采用网络 1 对 1 的答疑形式。在这里,我们能提供不同难度的习题辅导的机会。只要您有电脑,学习成绩优秀,在空闲时解题,然后用文字 or 文档的形式给学生答疑解惑即可。 【时间】 我们是灵活...赞 1评论 4浏览 1106 - 发布于2023-10-11 15:27:42
一文七问 | 论文分享:大规模多智能体系统的分层均值场深度强化学习
@toc 导读 本篇推文将为大家介绍中山大学余超老师于 2023 AAAI 发表的一篇论文: Hierarchical Mean-Field Deep Reinforcement Learning for Large-Scale Multiagent Sy...赞 3评论 8浏览 1779 -
灵初智能 2025年算法、软件工程、硬件研发等岗位火热招聘中,简历请投至:hr@psirobot.ai。 1、强化学习算法 北京 2、多模态大模型算法 北京 3、运控算法 深圳 4、仿真平台工程师 北京 5、数据平台全栈工程师 北京 6、Infra架构师 北京 7、机械结构工程师 深圳 8、电子/电控工程师 深圳 9、售前解决方案工程师 10、项目技术交付工程师
发布于10天前招贤纳士 | 北京灵初智能科技有限公司招聘RL强化学习、多模态大模型、运控算法等岗位招聘,可实习
北京灵初智能科技有限公司是全球具身智能赛道灵巧操作领域的领跑者,专注于让智能体获得物理世界的生存智慧,我们: 🤖 拥有国内最强、科学家密度最高的具身智能大模型团队,汇聚顶尖智慧,携手北大共建北大-灵初具身灵巧操作联合实验室 🏆 自主研发的灵巧手实现高度自...赞评论浏览 182 - 发布于2024-03-11 14:09:55
前端、web、可视化、C#...
前端、Web、可视化、C#... 岗位要求: 1、英语有较好的阅读能力,四六级或雅思 6.5+ 或托福 90+; 2、985/211 院校本科大三以上,研究生、硕士等;(国内外应往届均可); 3、做事一定要认真负责有耐心,工作时间地点不限; V:pan95...赞评论 8浏览 720 - 发布于2023-10-03 15:04:20
招聘线上答疑老师
【介绍】 我们是一家专注于为大学生群体提供课后习题答疑的教育机构,采用网络 1 对 1 的答疑形式。在这里,我们能提供不同难度的习题辅导的机会。只要您有电脑,学习成绩优秀,在空闲时解题,然后用文字 or 文档的形式给学生答疑解惑即可。 【时间】 我们是灵活...赞 1评论 4浏览 1034 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2025-01-10 10:22:00RNN策略训练稳定性提升秘籍:给RNN设置单独的学习率
在实际的决策任务中,信息常常是受限的,我们常常只能基于局部的信息进行决策或控制。例如在机器人操控的场景下,机器人只能观测到摄像头视角内的物体。现有的研究工作通常会结合历史的观测来补齐缺失的信息。循环强化学习(recurrent RL)使用循环神经网络来对历...赞评论浏览 183 - 发布于2024-09-05 13:53:56
入门强化学习的小白求助
各位前辈们好,我目前本科软件工程二年级在读,在自学 CS285 等相关课程,有些吃力。想问问前辈们有无深度强化学习的入门经验或者学习路线的分享?! 或者近期有哪些很不错的方向值得关注和研究! 欢迎批评和指导,谢谢大家。赞评论 4浏览 1116