大模型 - 话题 | RLChina 强化学习社区

Willing Star 这家伙很懒，什么都没留下

发布于2024-04-22 15:56:15

通用决策模型路在何方？
有同学在研究决策通用模型吗？不知道这个发现会向那个方向发展。目前的一些思路比如传统的 meta-RL、domain adaption for RL、decision transformer 类的工作如 Gato、VLM 策略如 RT 系列，还有通用环境模型...

赞 3

评论 3

浏览 1074

水区
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-16 15:51:21

ChatGPT和大模型春季课程Day4：港中文（深圳）助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用
RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周，分为专题报告、实践课和话题讨论三个部分。今天【ChatGPT 和大...

赞

评论 5

浏览 1775

课程学习
安远AI 陈英面向人工智能安全和风险前沿问题推动国际交流、开展治理研究、提供战略咨询、以及建立技术社区。

发布于2022-07-06 18:26:56

剑桥大学助理教授David Krueger：我们如何能让AI系统追求正确的目标？
导读「迈向安全、可靠、可控的人工智能」系列讲座第三场 David Krueger 是剑桥大学助理教授，作为剑桥大学计算和生物学习实验室（Computational and Biological Learning Lab）的成员，Krueger 领导着一个...

赞

评论

浏览 1351

学术活动
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-02-23 12:55:42

ChatGPT引爆大模型，数研院决策智能成果“小”起底
ChatGPT 爆火再度引发了各界对于大模型的关注，内容生成（AIGC）已经展示出大模型对于实际应用的高效提升，也让业界对于其赋能实际应用有了更多期待。在内容生成之上，社会更需要借助大模型去做更深层次的决策辅助，行动生成（AIGA）是进阶的深水区。 AIG...

赞

评论

浏览 1369

水区
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-07 15:23:33

课程活动｜ChatGPT 和大模型春季课程
RLChina 联合上海数字大脑研究院共同主办了此次 ChatGPT 和大模型春季课程，课程邀请了全球相关领域知名专家和学者深入讲解 ChatGPT 和大模型的原理和实践，从不同的角度探讨“ChatGPT 以后的通用人工智能理论和应用”。课程为期一周，分为...

赞 1

评论

浏览 1297

学术活动
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-17 14:43:50

ChatGPT和大模型春季课程Day5:大咖齐聚，探讨ChatGPT后的通用人工智能理论和应用
RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周，分为实践课、专题报告和话题讨论三个部分。 ChatGPT 的走红再次...

赞

评论

浏览 1179

课程学习
上海数字大脑研究院上海数字大脑研究院（简称“数研院”）汇聚决策智能领域全球领先的科研力量，面向中国及全球产业智能化升级需求，致力于为全球企业提供决策智能解决方案，驱动各产业全面智能化升级。立志做中国产业进步的价值创新者，让决策更科学、更高效、更智能。

发布于2023-03-28 14:20:08

谜题科技引领AI新时代：Enigma Alpha开启全新人工智能生成决策动作篇章！
近日，上海数字大脑研究院孵化的独立初创企业谜题科技（Enigma Tech.）发布了 AIGA（人工智能生成动作）系统 Enigma Alpha，实现了自然语言对话交互、工具增强的自然语言交互、以自然语言为接口的物理/虚拟世界交互和通用决策 AI App ...

赞 1

评论

浏览 1299

水区
C

C CharlesZhang 这家伙很懒，什么都没留下

发布于2024-01-15 10:25:20

RLChina 论文研讨会第73期（2024.01.16直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 和 Agent 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 73 期论文研讨会将由香港中文大学（深圳）博士生张策尧主持，围绕 agent 话题，邀请北京通用人工...

赞

评论

浏览 1517

水区
星

星星空713 这家伙很懒，什么都没留下

发布于2025-03-05 17:03:31

上海算法创新研究院：推理大模型算法实习生招聘(强化方向)
【简介】我们是上海算法创新研究院的大模型团队，成员来自于普林斯顿大学、卡内基梅隆大学、北京大学、上海交通大学、浙江大学、中科院等国内外知名高校和阿里、华为、美团等知名企业，具有丰富的研究和实践经验。我们致力于探索创建行业领先的大模型，为行业共性需求提供解决...

赞

评论

浏览 995

水区
Jane 量化从业8年+/求贤若渴/不设阈值 wechat：Tangle_2013

发布于2025-10-22 15:21:49

各位玩家：九坤量化联赛第三期“极限Code双赛季”倒计时报名6天！九坤今年最后一期量化赛题形式升级： “ACM 预赛 + AI挑战赛总决赛” ，挑战Code极限！ 📍赛事赛程介绍预赛赛题简介第一轮：预赛 | Accepted极限代码巅峰赛本期赛题由 NOI 金牌 + IOI 金牌选手联合命题，旨在挑战实力与速度的极限。采用经典的ACM赛制，参赛者需以2人团队形式，在3个小时内解决7个有挑战性的题目。实时评测，解题数目多者排名靠前。若存在多团队解题数一样，罚时低者靠前。预赛排名前25名的队伍晋级决赛！决赛赛题简介第二轮：决赛 | 坤星保卫战入围决赛方式：预赛排名前25名的队伍决赛赛题介绍：坤星上的堡垒正在遭受不明怪物的袭击，需要你利用手上的资源，尽全力击退坤星上的不明怪物。怪物沿着折线地图从起点走向终点，玩家需要在地图上布置防御塔，抵抗尽可能多轮次的怪物进攻。 ➡玩家获得信息：在每一轮游戏开始前，玩家会得到该轮游戏的地图坐标信息，以及怪物信息和可用的防御塔信息，其中部分关键信息将以文本描述的形式给出。 ➡玩家采取行动：玩家需要设计模型以理解获得的文本内容，然后在有限的成本下购买防御塔，并在地图上排兵布阵，抵抗逐渐变强的怪物。赛事考察技能：大语言模型的文本理解、推理、规划能力。 📍赛事奖励详情预赛： 1) 前50名团队获得伴手礼：九坤定制棒球帽+九坤定制T-恤 2）Ubi-Accepted 代码王者奖（前三个队伍）：任天堂游戏机决赛： 1）冠军团队：50,000元现金、荣誉证书、每位选手可获得大疆Osmo 360 畅拍套 2）亚军团队：30,000元现金、荣誉证书、每位选手可获得富士拍立得 WIDE Evo 3）季军团队：10,000元现金、荣誉证书、每位选手可获得苹果AirPods pro3 4）特色队伍：5,000元现金、荣誉证书、每位选手可获得罗技G913TKL无线机械键盘 *以上奖品支持等价自定义入围决赛团队均获得阳光普照：九坤限量版礼包 📍赛事日程报名截止：2025.10.27 18:00 预赛阶段：10月28日（周二）晚19:00——22:00 入围公布：10月30日（周四）公测阶段：10月30-11月16日（周日）线下决赛：11月29日（周六）全天比赛详情：https://mp.weixin.qq.com/s/FQXrPKm1eY0SGNGM4oLC4A 点击参赛：https://competition.nowcoder.com/220/introduce#403

赞 2

评论

浏览 1000

学科竞赛
胡紫灿-南京大学这家伙很懒，什么都没留下

发布于2025-11-05 11:17:24

RLChina 论文研讨会第134期（2025.11.11直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 134 期论文研讨会将由南京大学博士生胡紫灿主持并报告，同时南京大学硕士生张世琳和吴文浩也会为大家分享他们在 Neu...

赞

评论

浏览 755

论文研讨
刘

刘刘金毅这家伙很懒，什么都没留下

发布于2025-11-25 21:10:11

RLChina 论文研讨会第137期（2025.12.2直播）
导读论文研讨会是 RLChina 举办的学术活动，由 RL 领域不同研究团队轮流担任主持人，邀请一线研究人员针对特定论文做交流分享。第 137 期论文研讨会将由天津大学博士生刘金毅主持，天津大学博士生李鹏翼、天津大学博士生张芊、帝国理工学院博士后研究员...

赞

评论

浏览 666

论文研讨

首次进入社区的小伙伴，欢迎了解以下事项，参与相关活动：

一、RLChina 组织形式：http://rlchina.org/topic/211

二、RLChina 2025 大会：http://rlchina.org/rlchina_2025

三、RLChina 2024 大会（可下载课件）：http://rlchina.org/rlchina_2024

四、RLChina 2023 大会（可下载课件）：http://rlchina.org/rlchina_2023

五、RLChina 2022 强化学习暑期课：http://rlchina.org/topic/491

六、RLChina 2021 强化学习暑期课：http://rlchina.org/topic/9?utm_source=pocket_saves

七、RLChina 智能体挑战赛：http://rlchina.org/topic/928

八、RLChina 前沿讲习班：http://rlchina.org/topic/215

九、RLChina 论文研讨会：http://rlchina.org/topic/219

Frei0d
1 帖子 • 9 评论

1201
Carlos
2 帖子 • 4 评论

957
R
Rlxia
0 帖子 • 0 评论

568
RLChina
125 帖子 • 77 评论

456
POLIXIR
44 帖子 • 5 评论

351
Rewrite
0 帖子 • 4 评论

215
pan95732
21 帖子 • 181 评论

203
vinbo
9 帖子 • 84 评论

168
支太行
17 帖子 • 34 评论

133
张海峰
4 帖子 • 43 评论

132