- 发布于2025-04-23 23:43:15
多智能体强化学习求助!
训练效果很好,奖励看着也收敛,最后的智能体表现在训练结束前的 100 个 episode 表现都不错,为什么最后保存下来的模型加载评估的时候效果大打折扣?已经开启了。eval(),然后评估时为了看智能体学习的程度,我没有更换评估的环境,仍然是之前训练的环境...赞评论 10浏览 247 - 发布于2025-03-02 17:49:20赞 2评论浏览 399
- 赞评论浏览 273
- 发布于2024-08-19 14:59:20
具身智能实习生招聘(上海)
白辰甲课题组招收具身智能/强化学习方向实习生 职责:进行相关科研工作,发表高水平国际学术论文。具体方向包括: 强化学习方向,包含离线学习、多智能体学习、探索和表征、安全强化学习、偏好学习、迁移和泛化等主题。 决策大模型,包括 LLM 规划,世界模型学习,多...赞 1评论浏览 932 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2024-07-26 11:12:22矢量智控L3级水务智能化——智慧加氯让生活用水无忧“氯”
近年来,随着居民对于用水安全和用水品质要求的不断提高,水处理技术和用水水质指标成为公众关注的焦点。加之国家相继颁布并完善了一系列法规,包括新国家标准《生活饮用水卫生标准》和《关于加强城市供水安全保障工作的通知》等,显现了政府对城镇供水这一重要民生工程的高度...赞评论浏览 621 - 发布于2024-07-26 10:50:39
【九坤投资仲夏赛季】量化新星挑战赛|股票模拟交易赛 报名邀请函
亲爱的同学们:九坤股票模拟交易赛正式开启报名! 全球顶尖高手同台竞技 体验真实的量化交易 过一把 quant trader 瘾 超丰厚奖金拿到手软 【赛题简介】 本次比赛平台为模拟股票交易所,该平台以真实股票市场数据为基础通过衍生数据进行模拟撮合交易;同时...赞 2评论 1浏览 1015 - 发布于2024-03-12 20:40:37赞 1评论 15浏览 2191