- 发布于2022-03-07 02:52:21赞 4评论 3浏览 329
-
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2021-12-25 09:43:32【比赛专用】 AI决策•强化学习落地挑战赛——学习制定平等的促销策略,基线(baseline)方案与代码
基线(baseline)方案与代码 本次挑战赛使用的技术方法不限。本文介绍南栖仙策为挑战赛提供的基线方案。基线方案基于 Polixir Revive SDK 【下载地址】,基线代码与样例提交代码参见比赛所提供的 starting_kit.zip。 在此方案...赞 3评论 4浏览 589 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2021-12-24 13:47:32AI决策•强化学习落地挑战赛——学习制定平等的促销策略,报名火热进行中
AI 决策•强化学习挑战赛【学习制定平等的促销策略】,报名火热进行中。比赛诚邀“挑战者”以 AI 营销策略者的身份共同助力智能营销,解决保障消费者权益前提下的营销挑战,考察参赛者 AI 决策的落地能力。欢迎前来挑战! 【比赛背景】 强化学习在围棋、游戏等...赞 1评论 1浏览 579 - 发布于2021-12-13 21:48:17赞评论浏览 238
-
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2021-12-16 18:14:41NeoRL: 接近真实世界的离线强化学习基准
众所周知,强化学习(RL)在游戏界的成功已经在 AI 界产生了轰动 ,不管是玩出历史高分的微软 AI,还是继围棋之后,人工智能又攻克的德州扑克,亦或是利用“左右互搏”来增强学习的 OpenAI。人工智能在不同的游戏中的最新得分已经超越了人类的水平。 当大家...赞 2评论浏览 326 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2022-01-27 14:59:53【更新•比赛基线(baseline)方案】 AI决策•强化学习落地挑战赛——学习制定平等的促销策略
本文重新更新了南栖仙策为挑战赛提供的基线方案,对基线方案做了更详细说明,欢迎大家查阅详细方案。 更新点: 1、 Revive SDK 更新至 0.6.0 版本; 2、 整理 baseline 代码,以提高可读性,并方便状态等的自定义修改(请关注新增的 u...赞评论浏览 280 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2022-01-27 18:43:13【VSCode Polixir Revive插件发布 • 基于Revive插件的Baseline设计】AI决策•强化学习落地挑战赛——学习制定平等的促销策略
本文提供了南栖仙策发布的 VSCode Polixir Revive 插件,以及基于此插件的基线(Baseline)方案设计指导,欢迎查阅。 1、VSCode Polixir Revive 插件正式发布 https://marketplace.visual...赞评论浏览 322 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2022-01-06 13:03:05【更新•基线(baseline)方案详解与代码示例】 AI决策•强化学习落地挑战赛——学习制定平等的促销策略
本文更新了南栖仙策为挑战赛提供的基线方案,对基线方案做了更详细说明,以及说明了如何评估和改善基线训练出的环境和模型策略。欢迎大家下载查阅。 1、基线方案基于 Polixir Revive SDK 【下载地址】 2、基线代码,样例提交代码,以及用于指导参赛者...赞评论浏览 309 -
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2022-02-11 15:19:16【复赛正式开启•报名参赛持续进行中】AI决策•强化学习落地挑战赛——学习制定平等的促销策略
AI 决策•强化学习挑战赛【学习制定平等的促销策略】,复赛正式开启中,同时继续开启注册参加比赛窗口,欢迎更多爱好者前来挑战! 【比赛概览】 1、为了鼓励更多参赛队伍参加竞赛,所有已注册队伍和个人都将自动进入下一轮竞赛 进入复赛队伍通过比赛平台下载新提供的更...赞评论浏览 214 - 发布于2022-02-28 22:26:57赞 6评论 2浏览 312
-
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于2022-02-28 18:15:37【比赛结果公布】AI决策•强化学习落地挑战赛——学习制定平等的促销策略
AI 决策•强化学习挑战赛【学习制定平等的促销策略】,比赛结果新鲜出炉,欢迎小伙伴们一起围观 TOP5 队伍吧! 【竞赛背景】 强化学习在围棋、游戏等环境展示出超越人类的决策能力。为促进强化学习在真实场景的应用,江苏省人工智能学会联合南栖仙策发起此次竞赛。...赞 1评论浏览 403 - 发布于2022-03-02 05:44:26赞 3评论浏览 208