Willing Star
这家伙很懒,什么都没留下
评论(3)
请
登录后发表观点
-
我目前的认识是 知识存在于数据中 而不是模型中,通用决策模型必须要解决的是从数据中发现因果逻辑才行。
我也有这种感觉,meta RL 里 gradient-based 方法通过精巧设计的元参数引入归纳偏置,context-based 通过数据引入归纳偏置。把 DT 这类也看成 context-based 的话,它是自己通过数据学到了归纳偏置。
-
我目前的认识是 知识存在于数据中 而不是模型中,通用决策模型必须要解决的是从数据中发现因果逻辑才行。
-
没研究过这一块,觉得你点评的很到位。关于通用决策模型,应该是需要的。如果有通用决策模型,那么在具体的任务上,期待轻量级的微调就可以达到很好的效果。