清木
safe learning
发布于

Safe Reinforcement Learning Baseline

评论(2)
  • 清木
    清木 回复
    你很特别 你很特别 2022-03-04 10:27:10

    老师,请教下 safe RL 相比 RL 是不是就是在模型训练上侧重考虑了安全性因素,加入了各种保证安全边界的策略?能否说下二者的区别?

    safe RL 相比 RL 的话考虑的目标会多一些,也就是说不止需要考虑 reward 性能,也考虑安全性能,目前有各种不同的 safe RL 方法,从概率约束优化,风险决策优化和可达性分析都有,感兴趣的话,可以看我们的最新工作,有详细介绍 safe RL, Link.

  • 你很特别
    你很特别 回复

    老师,请教下 safe RL 相比 RL 是不是就是在模型训练上侧重考虑了安全性因素,加入了各种保证安全边界的策略?能否说下二者的区别?