- 发布于2025-08-11 14:32:33
找线上辅导老师
现需要一下方面的老师: 机器学习、数据挖掘、计算机视觉、spark、Scala、Swift、安卓、算法、前端、汇编、nodejs、电气工程、机械、数据科学、数据分析、eviews、stata、R 语言、SAS、实证、生物统计、市场营销、国际贸易、项目管理、...赞评论 1浏览 254 - 发布于2025-07-28 08:45:50
兼职辅导老师
【工作内容】主要是解答本科学术方面的问题,辅导题目答疑 兼职职位 ,不坐班,等待公司分配任务,时间自由 【薪资】200-1000/次 时薪 200 起 【要求】国内 985/211 院校在读或毕业,或者国外前 300 的院校 英语水平:四六级 500+/雅...赞评论 1浏览 329 - 发布于2025-07-03 10:43:38
找线上辅导老师
根据要求完成操作系统相关题目,也就是用英文做题, 只要你日常专业的核心课程掌握的扎实,有空闲时间那么这个线上做题就非常适合你 薪资:一单 200-800 不等(能力越强,报酬越高) 要求: 1.国内 985/211 院校在读或毕业,或者国外前 200 的院...赞评论 4浏览 333 - 发布于2025-07-15 13:06:18赞评论浏览 790
- 发布于2025-04-23 23:43:15
多智能体强化学习求助!
训练效果很好,奖励看着也收敛,最后的智能体表现在训练结束前的 100 个 episode 表现都不错,为什么最后保存下来的模型加载评估的时候效果大打折扣?已经开启了。eval(),然后评估时为了看智能体学习的程度,我没有更换评估的环境,仍然是之前训练的环境...赞评论 10浏览 485 - 发布于2025-03-02 17:49:20赞 2评论浏览 653
- 发布于2024-07-16 10:02:13
多智能体训练中,qmix、vdn发散而ippo缓慢收敛
代码使用的是 pymarl,环境是 cityflow,评价指标是 average travel time(越小越好),可见 ippo 的评价指标缓慢变小,qmix、vdn 直接发散了。 导致发散的可能原因是什么呢? ippo 收敛慢又是什么原因呢? i...赞评论 3浏览 1001 - 赞评论浏览 452