RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
AINova
AINova 研究强化学习,时空众包
发布于 2021-11-05 11:09:12

使用最基础的Policy Gradient训练不收敛,有没有懂的大佬朋友

经验分享
浏览 (1265) 点赞 收藏
评论(1)
请 登录后发表观点
  • vinbo
    vinbo 2021-11-05 14:09:42 回复

    最基础的 PG 本来也不是全局收敛

AINova
AINova
研究强化学习,时空众包
  • 关注了
    2
  • 关注者
    1
  • 积分
    99
  • 注册排名
    136
关于 标签 友链