Willing Star
这家伙很懒,什么都没留下
发布于

通用决策模型路在何方?

评论(3)
  • Willing Star
    Willing Star 回复
    Supercata Supercata 2024-04-23 20:00:44

    我目前的认识是 知识存在于数据中 而不是模型中,通用决策模型必须要解决的是从数据中发现因果逻辑才行。

    我也有这种感觉,meta RL 里 gradient-based 方法通过精巧设计的元参数引入归纳偏置,context-based 通过数据引入归纳偏置。把 DT 这类也看成 context-based 的话,它是自己通过数据学到了归纳偏置。

  • Supercata
    Supercata 回复

    我目前的认识是 知识存在于数据中 而不是模型中,通用决策模型必须要解决的是从数据中发现因果逻辑才行。

  • Chief 回复

    没研究过这一块,觉得你点评的很到位。关于通用决策模型,应该是需要的。如果有通用决策模型,那么在具体的任务上,期待轻量级的微调就可以达到很好的效果。