清木 safe learning 发布于 2022-03-03 00:56:53 Safe Reinforcement Learning Baseline 经验分享 #Safe-RL#Baselines 浏览 (1427) 点赞 (7) 收藏 评论(2) 请 登录后发表观点 清木 2022-03-08 23:26:56 回复 你很特别 2022-03-04 10:27:10 老师,请教下 safe RL 相比 RL 是不是就是在模型训练上侧重考虑了安全性因素,加入了各种保证安全边界的策略?能否说下二者的区别? safe RL 相比 RL 的话考虑的目标会多一些,也就是说不止需要考虑 reward 性能,也考虑安全性能,目前有各种不同的 safe RL 方法,从概率约束优化,风险决策优化和可达性分析都有,感兴趣的话,可以看我们的最新工作,有详细介绍 safe RL, Link. 你很特别 2022-03-04 10:27:10 回复 老师,请教下 safe RL 相比 RL 是不是就是在模型训练上侧重考虑了安全性因素,加入了各种保证安全边界的策略?能否说下二者的区别? 到底啦