vivian
这家伙很懒,什么都没留下
评论(4)
请
登录后发表观点
-
@YanSong 给的链接解释的挺棒的。
一般情况下,结论就是:MC 无偏,TD 有偏;MC 比 TD 方差大。- 你想象一下,如果你可以无限次采样的情况,MC 能把所有的真实样本都采集到,得出的结果肯定是无偏的,但是 TD 却不行,因为它每次采样都加入了估计值,所以必然是有偏的。
- 至于为什么 MC 比 TD 方差大,是因为我们做不到无限次采样,而在有限次采样的情况下,显然是每次采样涉及的不确定因素更多的方法波动更大,即方差更大,然后你对比以下 MC 和 TD 两种方法即可。
- 虽然因为每次采样涉及的不确定性因素多导致 MC 比 TD 方差大,但是这也使得 MC 对初始值不敏感,各有利弊吧。
- 上面这些其实都是一些感性的理解,如果你觉得不够,需要能够用数学语言来描述,那么你可以看一下链接:
https://web.stanford.edu/class/cme241/lecture_slides/VarianceMCvsTD.pdf
通俗易懂赞
-
@YanSong 给的链接解释的挺棒的。
一般情况下,结论就是:MC 无偏,TD 有偏;MC 比 TD 方差大。- 你想象一下,如果你可以无限次采样的情况,MC 能把所有的真实样本都采集到,得出的结果肯定是无偏的,但是 TD 却不行,因为它每次采样都加入了估计值,所以必然是有偏的。
- 至于为什么 MC 比 TD 方差大,是因为我们做不到无限次采样,而在有限次采样的情况下,显然是每次采样涉及的不确定因素更多的方法波动更大,即方差更大,然后你对比以下 MC 和 TD 两种方法即可。
- 虽然因为每次采样涉及的不确定性因素多导致 MC 比 TD 方差大,但是这也使得 MC 对初始值不敏感,各有利弊吧。
- 上面这些其实都是一些感性的理解,如果你觉得不够,需要能够用数学语言来描述,那么你可以看一下链接:
https://web.stanford.edu/class/cme241/lecture_slides/VarianceMCvsTD.pdf
感谢回复!明白了。谢谢
-
@YanSong 给的链接解释的挺棒的。
一般情况下,结论就是:MC 无偏,TD 有偏;MC 比 TD 方差大。- 你想象一下,如果你可以无限次采样的情况,MC 能把所有的真实样本都采集到,得出的结果肯定是无偏的,但是 TD 却不行,因为它每次采样都加入了估计值,所以必然是有偏的。
- 至于为什么 MC 比 TD 方差大,是因为我们做不到无限次采样,而在有限次采样的情况下,显然是每次采样涉及的不确定因素更多的方法波动更大,即方差更大,然后你对比以下 MC 和 TD 两种方法即可。
- 虽然因为每次采样涉及的不确定性因素多导致 MC 比 TD 方差大,但是这也使得 MC 对初始值不敏感,各有利弊吧。
- 上面这些其实都是一些感性的理解,如果你觉得不够,需要能够用数学语言来描述,那么你可以看一下链接:
https://web.stanford.edu/class/cme241/lecture_slides/VarianceMCvsTD.pdf