- 发布于2024-03-11 14:09:55
前端、web、可视化、C#...
前端、Web、可视化、C#... 岗位要求: 1、英语有较好的阅读能力,四六级或雅思 6.5+ 或托福 90+; 2、985/211 院校本科大三以上,研究生、硕士等;(国内外应往届均可); 3、做事一定要认真负责有耐心,工作时间地点不限; V:pan95...赞评论 6浏览 562 - 发布于2023-08-27 16:24:26
招聘线上答疑老师
【介绍】 我们是一家专注于为大学生群体提供课后习题答疑的教育机构,采用网络 1 对 1 的答疑形式。在这里,我们能提供不同难度的习题辅导的机会。只要您有电脑,学习成绩优秀,在空闲时解题,然后用文字 or 文档的形式给学生答疑解惑即可。 【时间】 我们是灵活...赞 1评论 4浏览 973 - 赞评论浏览 53
- POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。发布于13天前
南栖仙策&南京大学联合提出更强泛化的大规模世界模型以辅助具身智能决策
世界模型在具身智能决策中扮演着关键角色。为了实现高效决策,世界模型必须具备强大的泛化能力,同时提供可靠的不确定性估计。基于此,南京大学与南栖仙策团队提出了一种通用的世界模型构建范式 WHALE,通过引入行为条件化机制和回溯推演技术,提升了世界模型的分布外泛...赞评论浏览 98 - 发布于2023-10-11 15:27:42
一文七问 | 论文分享:大规模多智能体系统的分层均值场深度强化学习
@toc 导读 本篇推文将为大家介绍中山大学余超老师于 2023 AAAI 发表的一篇论文: Hierarchical Mean-Field Deep Reinforcement Learning for Large-Scale Multiagent Sy...赞 3评论 7浏览 1514 - 赞评论浏览 81
- 发布于2024-09-05 13:53:56
入门强化学习的小白求助
各位前辈们好,我目前本科软件工程二年级在读,在自学 CS285 等相关课程,有些吃力。想问问前辈们有无深度强化学习的入门经验或者学习路线的分享?! 或者近期有哪些很不错的方向值得关注和研究! 欢迎批评和指导,谢谢大家。赞评论 3浏览 801 - 发布于2022-08-18 23:57:11
【学术讨论】对抗智能体遇强则强,遇弱偏弱的现象的必然性?
我从去年参加暑期活动就发现这件事了。我先描述一下: 一个对抗性 agent, 比方说贪吃蛇 1v1, 或者翻转棋等,如果 agent 非完全碾压性,但实力非常强,在金榜稳定下来至少进前 5 比方,这样一个 agent 在刚入金榜的时候,周围对手都是比较弱的...赞评论 11浏览 1695