-
POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
发布于1天前探寻智能体自己的语言——迈向人机交互强化学习
在人机交互场景中,强化学习能够训练智能体按照人类语言指令完成任务。 以往的算法通常直接将人类语言提供给智能体,然后使用强化学习优化方法来提升智能体的策略,以完成人类指定的任务。然而,人类语言的学习难度高,与解决具体决策任务的复杂度不相匹配。为此,南栖仙策和...赞 1评论浏览 23 - 赞评论 8浏览 804