RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • Willing Star
    Willing Star Willing Star 这家伙很懒,什么都没留下
    发布于2024-04-22 15:56:15

    通用决策模型路在何方?

    有同学在研究决策通用模型吗?不知道这个发现会向那个方向发展。目前的一些思路比如传统的 meta-RL、domain adaption for RL、decision transformer 类的工作如 Gato、VLM 策略如 RT 系列,还有通用环境模型...
    赞 2
    评论 3
    浏览 627
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-16 15:51:21

    ChatGPT和大模型春季课程Day4:港中文(深圳)助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为专题报告、实践课和话题讨论三个部分。 今天【ChatGPT 和大...
    赞
    评论 5
    浏览 1172
    课程学习
  • 安远AI 陈英
    安远AI 陈英 安远AI 陈英 面向人工智能安全和风险前沿问题推动国际交流、开展治理研究、提供战略咨询、以及建立技术社区。
    发布于2022-07-06 18:26:56

    剑桥大学助理教授David Krueger:我们如何能让AI系统追求正确的目标?

    导读 「迈向安全、可靠、可控的人工智能」系列讲座第三场 David Krueger 是剑桥大学助理教授,作为剑桥大学计算和生物学习实验室(Computational and Biological Learning Lab)的成员,Krueger 领导着一个...
    赞
    评论
    浏览 938
    学术活动
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-02-23 12:55:42

    ChatGPT引爆大模型,数研院决策智能成果“小”起底

    ChatGPT 爆火再度引发了各界对于大模型的关注,内容生成(AIGC)已经展示出大模型对于实际应用的高效提升,也让业界对于其赋能实际应用有了更多期待。在内容生成之上,社会更需要借助大模型去做更深层次的决策辅助,行动生成(AIGA)是进阶的深水区。 AIG...
    赞
    评论
    浏览 960
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-07 15:23:33

    课程活动|ChatGPT 和大模型春季课程

    RLChina 联合上海数字大脑研究院共同主办了此次 ChatGPT 和大模型春季课程,课程邀请了全球相关领域知名专家和学者深入讲解 ChatGPT 和大模型的原理和实践,从不同的角度探讨“ChatGPT 以后的通用人工智能理论和应用”。课程为期一周,分为...
    赞 1
    评论
    浏览 836
    学术活动
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-17 14:43:50

    ChatGPT和大模型春季课程Day5:大咖齐聚,探讨ChatGPT后的通用人工智能理论和应用

    RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为实践课、专题报告和话题讨论三个部分。 ChatGPT 的走红再次...
    赞
    评论
    浏览 749
    课程学习
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-28 14:20:08

    谜题科技引领AI新时代:Enigma Alpha开启全新人工智能生成决策动作篇章!

    近日,上海数字大脑研究院孵化的独立初创企业谜题科技(Enigma Tech.)发布了 AIGA(人工智能生成动作)系统 Enigma Alpha,实现了自然语言对话交互、工具增强的自然语言交互、以自然语言为接口的物理/虚拟世界交互和通用决策 AI App ...
    赞 1
    评论
    浏览 875
    水区
  • C
    C CharlesZhang 这家伙很懒,什么都没留下
    发布于2024-01-15 10:25:20

    RLChina 论文研讨会第73期(2024.01.16直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 和 Agent 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。 第 73 期论文研讨会将由香港中文大学(深圳)博士生张策尧主持,围绕 agent 话题,邀请北京通用人工...
    赞
    评论
    浏览 854
    水区
  • 星
    星 星空713 这家伙很懒,什么都没留下
    发布于2025-03-05 17:03:31

    上海算法创新研究院:推理大模型算法实习生招聘(强化方向)

    【简介】我们是上海算法创新研究院的大模型团队,成员来自于普林斯顿大学、卡内基梅隆大学、北京大学、上海交通大学、浙江大学、中科院等国内外知名高校和阿里、华为、美团等知名企业,具有丰富的研究和实践经验。我们致力于探索创建行业领先的大模型,为行业共性需求提供解决...
    赞
    评论
    浏览 382
    水区
签到
0
立即签到
合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    918
  • R
    Rlxia

    0 帖子 • 0 评论

    568
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链