求问面试题: MC和TD分别是无偏估计吗，为什么？MC、TD谁的方差大，为什么？

课程学习 #蒙特卡洛

浏览 (2371) 点赞 (3) 收藏

AINova 2021-10-14 19:24:00 回复
无法解出的问题 2021-10-12 17:19:25
@YanSong 给的链接解释的挺棒的。
一般情况下，结论就是：MC 无偏，TD 有偏；MC 比 TD 方差大。
1. 你想象一下，如果你可以无限次采样的情况，MC 能把所有的真实样本都采集到，得出的结果肯定是无偏的，但是 TD 却不行，因为它每次采样都加入了估计值，所以必然是有偏的。
2. 至于为什么 MC 比 TD 方差大，是因为我们做不到无限次采样，而在有限次采样的情况下，显然是每次采样涉及的不确定因素更多的方法波动更大，即方差更大，然后你对比以下 MC 和 TD 两种方法即可。
3. 虽然因为每次采样涉及的不确定性因素多导致 MC 比 TD 方差大，但是这也使得 MC 对初始值不敏感，各有利弊吧。
4. 上面这些其实都是一些感性的理解，如果你觉得不够，需要能够用数学语言来描述，那么你可以看一下链接：
  https://web.stanford.edu/class/cme241/lecture_slides/VarianceMCvsTD.pdf
通俗易懂赞
vivian 2021-10-13 21:51:56 回复
无法解出的问题 2021-10-12 17:19:25
@YanSong 给的链接解释的挺棒的。
一般情况下，结论就是：MC 无偏，TD 有偏；MC 比 TD 方差大。
1. 你想象一下，如果你可以无限次采样的情况，MC 能把所有的真实样本都采集到，得出的结果肯定是无偏的，但是 TD 却不行，因为它每次采样都加入了估计值，所以必然是有偏的。
2. 至于为什么 MC 比 TD 方差大，是因为我们做不到无限次采样，而在有限次采样的情况下，显然是每次采样涉及的不确定因素更多的方法波动更大，即方差更大，然后你对比以下 MC 和 TD 两种方法即可。
3. 虽然因为每次采样涉及的不确定性因素多导致 MC 比 TD 方差大，但是这也使得 MC 对初始值不敏感，各有利弊吧。
4. 上面这些其实都是一些感性的理解，如果你觉得不够，需要能够用数学语言来描述，那么你可以看一下链接：
  https://web.stanford.edu/class/cme241/lecture_slides/VarianceMCvsTD.pdf
感谢回复！明白了。谢谢
无法解出的问题 2021-10-12 17:19:25 回复
@YanSong 给的链接解释的挺棒的。
一般情况下，结论就是：MC 无偏，TD 有偏；MC 比 TD 方差大。
1. 你想象一下，如果你可以无限次采样的情况，MC 能把所有的真实样本都采集到，得出的结果肯定是无偏的，但是 TD 却不行，因为它每次采样都加入了估计值，所以必然是有偏的。
2. 至于为什么 MC 比 TD 方差大，是因为我们做不到无限次采样，而在有限次采样的情况下，显然是每次采样涉及的不确定因素更多的方法波动更大，即方差更大，然后你对比以下 MC 和 TD 两种方法即可。
3. 虽然因为每次采样涉及的不确定性因素多导致 MC 比 TD 方差大，但是这也使得 MC 对初始值不敏感，各有利弊吧。
4. 上面这些其实都是一些感性的理解，如果你觉得不够，需要能够用数学语言来描述，那么你可以看一下链接：
  https://web.stanford.edu/class/cme241/lecture_slides/VarianceMCvsTD.pdf
YanSong 2021-10-09 17:57:00 回复

可参考 https://stats.stackexchange.com/questions/355820/why-do-temporal-difference-td-methods-have-lower-variance-than-monte-carlo-met