通用决策模型路在何方？

Willing Star 2024-04-24 18:08:21 回复

 Supercata 2024-04-23 20:00:44

我目前的认识是知识存在于数据中而不是模型中，通用决策模型必须要解决的是从数据中发现因果逻辑才行。

我也有这种感觉，meta RL 里 gradient-based 方法通过精巧设计的元参数引入归纳偏置，context-based 通过数据引入归纳偏置。把 DT 这类也看成 context-based 的话，它是自己通过数据学到了归纳偏置。
Supercata 2024-04-23 20:00:44 回复

我目前的认识是知识存在于数据中而不是模型中，通用决策模型必须要解决的是从数据中发现因果逻辑才行。
C

Chief 2024-04-23 17:36:46 回复

没研究过这一块，觉得你点评的很到位。关于通用决策模型，应该是需要的。如果有通用决策模型，那么在具体的任务上，期待轻量级的微调就可以达到很好的效果。