RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • Willing Star
    Willing Star Willing Star 这家伙很懒,什么都没留下
    发布于2024-04-22 15:56:15

    通用决策模型路在何方?

    有同学在研究决策通用模型吗?不知道这个发现会向那个方向发展。目前的一些思路比如传统的 meta-RL、domain adaption for RL、decision transformer 类的工作如 Gato、VLM 策略如 RT 系列,还有通用环境模型...
    赞 2
    评论 3
    浏览 761
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-16 15:51:21

    ChatGPT和大模型春季课程Day4:港中文(深圳)助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为专题报告、实践课和话题讨论三个部分。 今天【ChatGPT 和大...
    赞
    评论 5
    浏览 1319
    课程学习
  • 安远AI 陈英
    安远AI 陈英 安远AI 陈英 面向人工智能安全和风险前沿问题推动国际交流、开展治理研究、提供战略咨询、以及建立技术社区。
    发布于2022-07-06 18:26:56

    剑桥大学助理教授David Krueger:我们如何能让AI系统追求正确的目标?

    导读 「迈向安全、可靠、可控的人工智能」系列讲座第三场 David Krueger 是剑桥大学助理教授,作为剑桥大学计算和生物学习实验室(Computational and Biological Learning Lab)的成员,Krueger 领导着一个...
    赞
    评论
    浏览 1062
    学术活动
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-02-23 12:55:42

    ChatGPT引爆大模型,数研院决策智能成果“小”起底

    ChatGPT 爆火再度引发了各界对于大模型的关注,内容生成(AIGC)已经展示出大模型对于实际应用的高效提升,也让业界对于其赋能实际应用有了更多期待。在内容生成之上,社会更需要借助大模型去做更深层次的决策辅助,行动生成(AIGA)是进阶的深水区。 AIG...
    赞
    评论
    浏览 1101
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-07 15:23:33

    课程活动|ChatGPT 和大模型春季课程

    RLChina 联合上海数字大脑研究院共同主办了此次 ChatGPT 和大模型春季课程,课程邀请了全球相关领域知名专家和学者深入讲解 ChatGPT 和大模型的原理和实践,从不同的角度探讨“ChatGPT 以后的通用人工智能理论和应用”。课程为期一周,分为...
    赞 1
    评论
    浏览 994
    学术活动
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-17 14:43:50

    ChatGPT和大模型春季课程Day5:大咖齐聚,探讨ChatGPT后的通用人工智能理论和应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为实践课、专题报告和话题讨论三个部分。 ChatGPT 的走红再次...
    赞
    评论
    浏览 883
    课程学习
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-28 14:20:08

    谜题科技引领AI新时代:Enigma Alpha开启全新人工智能生成决策动作篇章!

    近日,上海数字大脑研究院孵化的独立初创企业谜题科技(Enigma Tech.)发布了 AIGA(人工智能生成动作)系统 Enigma Alpha,实现了自然语言对话交互、工具增强的自然语言交互、以自然语言为接口的物理/虚拟世界交互和通用决策 AI App ...
    赞 1
    评论
    浏览 1012
    水区
  • C
    C CharlesZhang 这家伙很懒,什么都没留下
    发布于2024-01-15 10:25:20

    RLChina 论文研讨会第73期(2024.01.16直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 和 Agent 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 73 期论文研讨会将由香港中文大学(深圳)博士生张策尧主持,围绕 agent 话题,邀请北京通用人工...
    赞
    评论
    浏览 1049
    水区
  • 星
    星 星空713 这家伙很懒,什么都没留下
    发布于2025-03-05 17:03:31

    上海算法创新研究院:推理大模型算法实习生招聘(强化方向)

    【简介】我们是上海算法创新研究院的大模型团队,成员来自于普林斯顿大学、卡内基梅隆大学、北京大学、上海交通大学、浙江大学、中科院等国内外知名高校和阿里、华为、美团等知名企业,具有丰富的研究和实践经验。我们致力于探索创建行业领先的大模型,为行业共性需求提供解决...
    赞
    评论
    浏览 626
    水区
  • Jane
    Jane Jane 量化从业8年+/求贤若渴/不设阈值 wechat:Tangle_2013
    发布于1天前
    各位玩家:九坤量化联赛第三期“极限Code双赛季”倒计时报名6天! 九坤今年最后一期量化赛题形式升级: “ACM 预赛 + AI挑战赛总决赛” ,挑战Code极限! 📍赛事赛程介绍 预赛赛题简介 第一轮:预赛 | Accepted极限代码巅峰赛 本期赛题由 NOI 金牌 + IOI 金牌选手联合命题,旨在挑战实力与速度的极限。 采用经典的ACM赛制,参赛者需以2人团队形式,在3个小时内解决7个有挑战性的题目。实时评测,解题数目多者排名靠前。若存在多团队解题数一样,罚时低者靠前。预赛排名前25名的队伍晋级决赛! 决赛赛题简介 第二轮:决赛 | 坤星保卫战 入围决赛方式:预赛排名前25名的队伍 决赛赛题介绍:坤星上的堡垒正在遭受不明怪物的袭击,需要你利用手上的资源,尽全力击退坤星上的不明怪物。怪物沿着折线地图从起点走向终点,玩家需要在地图上布置防御塔,抵抗尽可能多轮次的怪物进攻。 ➡玩家获得信息:在每一轮游戏开始前,玩家会得到该轮游戏的地图坐标信息,以及怪物信息和可用的防御塔信息,其中部分关键信息将以文本描述的形式给出。 ➡玩家采取行动:玩家需要设计模型以理解获得的文本内容,然后在有限的成本下购买防御塔,并在地图上排兵布阵,抵抗逐渐变强的怪物。 赛事考察技能:大语言模型的文本理解、推理、规划能力。 📍赛事奖励详情 预赛: 1) 前50名团队获得伴手礼:九坤定制棒球帽+九坤定制T-恤 2)Ubi-Accepted 代码王者奖(前三个队伍) :任天堂游戏机 决赛: 1)冠军团队:50,000元现金、荣誉证书、每位选手可获得大疆Osmo 360 畅拍套 2)亚军团队:30,000元现金 、荣誉证书、每位选手可获得富士拍立得 WIDE Evo 3)季军团队:10,000元现金、荣誉证书、每位选手可获得苹果AirPods pro3 4)特色队伍:5,000元现金、荣誉证书、每位选手可获得罗技G913TKL无线机械键盘 *以上奖品支持等价自定义 入围决赛团队均获得阳光普照:九坤限量版礼包 📍赛事日程 报名截止:2025.10.27 18:00 预赛阶段:10月28日(周二)晚19:00——22:00 入围公布:10月30日(周四) 公测阶段:10月30-11月16日(周日) 线下决赛:11月29日(周六)全天 比赛详情:https://mp.weixin.qq.com/s/FQXrPKm1eY0SGNGM4oLC4A 点击参赛:https://competition.nowcoder.com/220/introduce#403
    赞 1
    评论
    浏览 203
    学科竞赛
签到
0
立即签到
合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2025 大会:http://rlchina.org/rlchina_2025

三、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

四、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛:http://rlchina.org/topic/928

八、RLChina 前沿讲习班:http://rlchina.org/topic/215

九、RLChina 论文研讨会:http://rlchina.org/topic/219

积分排行
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    1038
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • R
    Rlxia

    0 帖子 • 0 评论

    568
  • RLChina
    RLChina

    124 帖子 • 77 评论

    455
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    168
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链