RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-06-28 17:08:01

    解决这两个世界级难题,自动驾驶就能够实现超进化?

    引言 自动驾驶领域近几年来一直备受关注,但截止目前,自动驾驶在现实复杂场景下的大规模部署应用却一再延后。 其中一个很重要的原因是,目前业界对于动态和强交互性场景下的行为、轨迹预测问题(behavior prediction)始终没有得出很好的解决方案。缺乏...
    赞
    评论
    浏览 106
    产业应用
  • POLIXIR
    POLIXIR POLIXIR 南栖仙策(Polixir)是南京大学人工智能创新研究院技术孵化企业,核心技术是通过推演亿万种决策的不同结果,找到通向未来的最优路径,实现现实世界自主决策系统。目前南栖仙策已研发出通用决策系统—仙启,开创性地提出数据驱动的虚拟环境构建技术,从少量历史交互数据中构建虚拟世界,寻找最优决策,避免在线试错的代价。
    发布于2021-12-16 18:14:41

    NeoRL: 接近真实世界的离线强化学习基准

    众所周知,强化学习(RL)在游戏界的成功已经在 AI 界产生了轰动 ,不管是玩出历史高分的微软 AI,还是继围棋之后,人工智能又攻克的德州扑克,亦或是利用“左右互搏”来增强学习的 OpenAI。人工智能在不同的游戏中的最新得分已经超越了人类的水平。 当大家...
    赞 2
    评论
    浏览 391
    产业应用
  • vinbo
    vinbo vinbo The whole life is a game...
    发布于2021-11-12 14:01:52

    大家收到这个AI项目合作邀请信了吗?

    我在 b 站收到的 你好 我们是一个加密货币 NFT 方面的团队,现在想做一些和 AI 有关的 NFT 项目,就是以 AI 本身为 NFT 进行交易的一个 GAMEFI 项目,AI 角色通过训练后,作为 NFT 装备包本身,进行交易。但我们对 AI 这块有...
    赞 4
    评论 5
    浏览 401
    产业应用
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-13 08:59:50

    请问大佬,我的DDPG算法不收敛是什么原因?

    DDPG 算法不收敛是我采样的数据随机性太大了吗
    赞
    评论 2
    浏览 442
    产业应用
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-11 17:41:34

    请问大佬FrozenLake中的FrozenLake-v1这个环境 “由于是冰面,每次行走有一定的概率滑行到附近的其它状态” 这句话应该怎么理解?

    也就是说状态转移中 在第 0 个状态下采取动作 0 后面跟的这三个四元组怎么理解? 0(state): {0(action): [(0.3333333333333333, 0, 0.0, False), (0.3333333333333333, 0, 0...
    赞
    评论 2
    浏览 362
    产业应用
  • Z
    Z zhangmou266 这家伙很懒,什么都没留下
    发布于2021-10-09 19:39:08

    强化学习在机器人领域的应用

    在人机交互的场景中,对于非常耗时的强化学习过程有什么 替代人类参与机器人学习过程的应对策略吗?
    赞 1
    评论
    浏览 357
    产业应用
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 强化学习暑期课(每年):http://rlchina.org/topic/9

三、RLChina 智能体挑战赛(每季):http://rlchina.org/topic/216

四、RLChina 前沿讲习班(每月):http://rlchina.org/topic/215

五、RLChina 论文研讨会(每周):http://rlchina.org/topic/219

合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

签到
0
立即签到
积分排行
  • RLChina
    RLChina

    98 帖子 • 49 评论

    316
  • Carlos
    Carlos

    2 帖子 • 2 评论

    280
  • POLIXIR
    POLIXIR

    27 帖子 • 3 评论

    190
  • Rewrite
    Rewrite

    0 帖子 • 1 评论

    163
  • 支太行
    支太行

    17 帖子 • 34 评论

    132
  • 张海峰
    张海峰

    4 帖子 • 37 评论

    125
  • AINova
    AINova

    20 帖子 • 40 评论

    90
  • vinbo
    vinbo

    6 帖子 • 34 评论

    85
  • daydayup
    daydayup

    4 帖子 • 33 评论

    82
  • 从头再来
    从头再来

    14 帖子 • 41 评论

    80
关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室