RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
O

Og

这家伙很懒,什么都没留下

个人成就
  • 积分
    1
  • 帖子
    1
  • 评论
    0
  • 注册排名
    2936
  • 关注了
    0
  • 关注者
    0
  • 帖子
  • 文章
  • O
    O Og 这家伙很懒,什么都没留下
    发布于2024-11-13 14:38:57
    同样一个使用rl_zoo3训练的模型,使用stablebaseline3的evaluate_policy和rl_zoo3的rl_zoo3.enjoy.enjoy测试出来的score为什么会差别很大哇 from stable_baselines3.common.evaluation import evaluate_policy model = sb3.PPO.load(model_path, env=env, print_system_info=True) mean_reward, std_reward = evaluate_policy(model, model.get_env(), n_eval_episodes=4)
    赞
    评论
    浏览 244
    论文研讨
关于 标签 友链