- 发布于2022-03-25 11:17:17赞评论浏览 170
- 赞评论浏览 160
- 发布于2021-11-28 10:47:55赞 3评论 3浏览 513
- 发布于2021-10-15 09:32:11
强化经典面试题(一)
已经入坑一段时间,想整理一个强化学习面试题专栏。这里面有参考网上的问题和答案,也有自己平时遇到的。欢迎来一起讨论 🥰 Let's start, shall we? 1. 什么是强化学习? 强化学习由环境、动作和奖励组成,强化学习的目标是使得作出的一系列决...赞 2评论 2浏览 599 - 赞 1评论 1浏览 253
- 发布于2021-10-07 17:06:54
方差缩减术
目前我所知的方差缩减技术有 3 类: 1、Baseline 方法; 2、TD 方法; 3、Reparameterization 方法; 欢迎补充其他的方差缩减方法~ 另外在 actor loss 中,是否可以导出像机器学习中的那种 bias-varianc...赞 2评论 1浏览 338