RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
AINova
AINova 研二在读,研究强化学习,时空众包
发布于 2021-11-05 11:09:12

使用最基础的Policy Gradient训练不收敛,有没有懂的大佬朋友

经验分享
浏览 (507) 点赞 收藏
评论(1)
请 登录后发表观点
  • vinbo
    vinbo 2021-11-05 14:09:42 回复

    最基础的 PG 本来也不是全局收敛

AINova
AINova
研二在读,研究强化学习,时空众包
  • 关注了
    1
  • 关注者
    1
  • 积分
    98
  • 注册排名
    136
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室