RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
O
Og
这家伙很懒,什么都没留下
个人成就
积分
1
帖子
1
评论
0
注册排名
2936
关注了
0
关注者
0
帖子
文章
O
O
Og
这家伙很懒,什么都没留下
发布于8天前
同样一个使用rl_zoo3训练的模型,使用stablebaseline3的evaluate_policy和rl_zoo3的rl_zoo3.enjoy.enjoy测试出来的score为什么会差别很大哇 from stable_baselines3.common.evaluation import evaluate_policy model = sb3.PPO.load(model_path, env=env, print_system_info=True) mean_reward, std_reward = evaluate_policy(model, model.get_env(), n_eval_episodes=4)
赞
评论
浏览
42
论文研讨
到底啦