POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。 发布于 2021-12-16 18:14:41 NeoRL: 接近真实世界的离线强化学习基准 产业应用 #离线强化学习 浏览 (1330) 点赞 (2) 收藏 评论 请 登录后发表观点 到底啦