- 赞评论浏览 76
- 发布于2022-06-08 12:13:41
玩转Python|类与方法的隐藏秘密(3)
上期为大家准备的 Python 攻略,从原理上讲了 Python 类的本质,接下来的两篇 Python 专栏里,继续来讲讲关于类及其方法的一些冷知识和烫知识。 我们也会和前面两篇专栏一样,用各种神奇的例子,从原理和机制的角度为你还原一个不一样的 Pytho...赞 1评论浏览 363 - 发布于2022-03-25 11:17:17赞评论浏览 405
- 赞评论浏览 358
- 发布于2021-11-28 10:47:55赞 3评论 3浏览 1187
- 发布于2021-10-15 09:32:11
强化经典面试题(一)
已经入坑一段时间,想整理一个强化学习面试题专栏。这里面有参考网上的问题和答案,也有自己平时遇到的。欢迎来一起讨论 🥰 Let's start, shall we? 1. 什么是强化学习? 强化学习由环境、动作和奖励组成,强化学习的目标是使得作出的一系列决...赞 2评论 2浏览 982 - 赞 1评论 1浏览 553
- 发布于2021-10-07 17:06:54
方差缩减术
目前我所知的方差缩减技术有 3 类: 1、Baseline 方法; 2、TD 方法; 3、Reparameterization 方法; 欢迎补充其他的方差缩减方法~ 另外在 actor loss 中,是否可以导出像机器学习中的那种 bias-varianc...赞 2评论 1浏览 591