RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-11-09 14:23:40

    如何在AI工程实践中选择合适的算法?

    在使用深度强化学习(Deep Reinforcement Learning,DRL)算法解决实际问题的过程中,明确任务需求并初步完成问题定义后,就可以为相关任务选择合适的 DRL 算法了。 以 DeepMind 的里程碑工作 AlphaGo 为起点,每年各...
    赞 1
    评论
    浏览 1002
    水区
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-11-30 10:12:28

    瞥一瞥AI,撩一撩算法

    本文转自【吕磊】 风和日丽的午后,你走在马路上。 一个人型机器人迎面走来,点头,微笑,挥手,和你擦肩而过。 你回头望去,街头绿灯下,机器人正小跑穿过人行横道,步伐轻盈,体态自然。 机器人渐行渐远…… 你停下脚步,浮想联翩。“我和它究竟有何分别?” “不,那...
    赞
    评论
    浏览 1128
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-05-05 11:00:37

    ICML 2023 | 数研院提出决策大模型经验回放系统GEAR,较DeepMind Reverb数据吞吐量最高提升至六倍!

    近日,上海数字大脑研究院(简称“数研院”)提出分布式经验回放系统 GEAR(又名 PipeDT),优化了现代 GPU 系统在数据储存、并行计算和高速通信的软硬件特性,更适用于 RL 大模型的经验回放过程。该项论文成果已被机器学习顶会 ICML2023 收录...
    赞
    评论
    浏览 863
    论文研讨
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-05-09 19:13:30

    FCS 2023|数研院发表面向序贯决策任务的大模型算法综述

    (部分内容由谜题科技的决策大模型“Enigma”撰写) 近日,上海数字大脑研究院(简称“数研院”)联合中英高校团队对于使用 Transformer 模型解决序贯决策任务的研究提供了全面的综述,为建立大型决策大模型提供了一系列潜在的研究方向。该论文已被 S...
    赞
    评论
    浏览 1397
    论文研讨
  • Jane
    Jane Jane 量化从业6年+/求贤若渴/不设阈值 wechat:Tangle_2013
    发布于2025-03-31 13:24:36
    各位玩家:九坤第八届量化联赛第一期 | UbiPoker AI赛开启报名! 【赛题简介】 本期比赛中,我们将带领大家挑战经典AI赛事,体验Poker AI对抗的魅力 【技能挑战】 (1)本期比赛将着重考察参赛者:AI设计能力,概率分析能力,实际问题解决能力 (2)选手需要以我们提供的程序平台为基础,可基于规则利用机器学习等方法,用自己擅长的策略开发一套AI程序,这些AI会在我们提供的平台上进行随机对抗,期待各位的表现。 【赛事激励】 Ubiquant opportunities:赛事专属面试直通卡 Ubiquant gifts:丰厚赛事奖金和奖品 Ubiquant challenge:硬核量化技术挑战 Ubiquant Conection:量化沙龙分享 本期奖项设置 冠军团队:50,000 元现金及荣誉证书 每位选手可获得 新款iPad Air11英寸 亚军团队:30,000 元现金及荣誉证书 每位选手可获得 Apple Watch Series 10 季军团队:10,000 元现金及荣誉证书 每位选手可获得 富士mini Liplay拍立得 UbiPoker特色队伍奖 - 5,000 元现金及荣誉证书 - SLOWPLAY Poker陶瓷筹码套装 点击下方链接立即报名,开启你的量化之旅。 比赛详情:https://mp.weixin.qq.com/s/ONfS_HNqX_jtvyFySQQ4sw
    赞
    评论
    浏览 307
    学科竞赛
签到
0
立即签到
合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    905
  • R
    Rlxia

    0 帖子 • 0 评论

    566
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链