这家伙很懒,什么都没留下
发布于

组合优化在强化学习领域是不是比较小众啊

评论(1)
  • shallwell 回复

    也不能说是脱节了,是面临的问题不一样,普通的 DRL 一个最重要的问题应该是样本的利用率,而在组合优化里我觉得还没有明显的遇到这个问题。