-
我今天也遇到了,很奇怪
-
很有意思,值得研究,可以把几个算法对垒的 winning rate 的 contingency matrix 画出来看看。 如果有这个现象 elo rating 就有问题,
可能是设计的时候考虑的是强手。
-
carlos 的算法描述在他的 blog 里,https://www.yuchen.xyz/2021/08/21/2021-08-21-jidi-snakes-3v3/,非常精彩
很有意思,值得研究,可以把几个算法对垒的 winning rate 的 contingency matrix 画出来看看。 如果有这个现象 elo rating 就有问题,
-
我也先搜到这篇了,这篇还是在神经网络的范畴。我描述的这个现象的诡异之处在于,基于传统的启发式搜索也会出现这个现象,包括 alphabet 剪枝,包括 carlos 的那个启发式搜索(他的 blog 里还有 slides,还有视频讲解)
-
carlos 怎么训练的?
carlos 的算法描述在他的 blog 里,https://www.yuchen.xyz/2021/08/21/2021-08-21-jidi-snakes-3v3/,非常精彩
-
杜老师,我看了一下 catastrophic forgetting 的概念,from this page: https://www.bairesdev.com/blog/what-is-catastrophic-forgetting/, 和我主帖中第 3 段的意思是一样的。然而,我最后一段举了 2 个非学习型智能体的例子,一个是 alphabet 剪枝,一个是纯专家库经验推理型的,这两个例子是不能用 catastrophic forgetting 来解释的吧?
carlos 怎么训练的?
-
这个应该是 RL 中 catastrophic forgetting 的问题。 可以看下 alphastar 的 blog 和讨论。
杜老师,我看了一下 catastrophic forgetting 的概念,from this page: https://www.bairesdev.com/blog/what-is-catastrophic-forgetting/, 和我主帖中第 3 段的意思是一样的。然而,我最后一段举了 2 个非学习型智能体的例子,一个是 alphabet 剪枝,一个是纯专家库经验推理型的,这两个例子是不能用 catastrophic forgetting 来解释的吧?
-
这个应该是 RL 中 catastrophic forgetting 的问题。 可以看下 alphastar 的 blog 和讨论。
哇,谢谢杜老师! 我去看看
-
这个应该是 RL 中 catastrophic forgetting 的问题。 可以看下 alphastar 的 blog 和讨论。
vinbo
The whole life is a game...
评论(11)
请
登录后发表观点