Safe Reinforcement Learning Baseline

清木 2022-03-08 23:26:56 回复

 你很特别 2022-03-04 10:27:10

老师，请教下 safe RL 相比 RL 是不是就是在模型训练上侧重考虑了安全性因素，加入了各种保证安全边界的策略？能否说下二者的区别？

safe RL 相比 RL 的话考虑的目标会多一些，也就是说不止需要考虑 reward 性能，也考虑安全性能，目前有各种不同的 safe RL 方法，从概率约束优化，风险决策优化和可达性分析都有，感兴趣的话，可以看我们的最新工作，有详细介绍 safe RL, Link.
你很特别 2022-03-04 10:27:10 回复

老师，请教下 safe RL 相比 RL 是不是就是在模型训练上侧重考虑了安全性因素，加入了各种保证安全边界的策略？能否说下二者的区别？