RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
李
李海
这家伙很懒,什么都没留下
个人成就
积分
1
帖子
1
评论
0
注册排名
742
关注了
0
关注者
0
帖子
文章
李
李
李海
这家伙很懒,什么都没留下
发布于2022-05-20 21:15:53
深度强化学习中神经网络的收敛问题?
各位老师和同学好,最近研究遇到一个疑惑,想发帖求助一下社区中的大神。 问题:强化学习中更新 Q 网络或者策略网络一般有期望更新和采样更新两种方式,我对于采样更新有一个疑问就是在采样的过程中伴随着随机性,这种随机性将直接导致 Q 值网络或者策略网络不能很好的...
赞
评论
浏览
1063
水区
到底啦