RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-07 15:23:33

    课程活动|ChatGPT 和大模型春季课程

    RLChina 联合上海数字大脑研究院共同主办了此次 ChatGPT 和大模型春季课程,课程邀请了全球相关领域知名专家和学者深入讲解 ChatGPT 和大模型的原理和实践,从不同的角度探讨“ChatGPT 以后的通用人工智能理论和应用”。课程为期一周,分为...
    赞 1
    评论
    浏览 809
    学术活动
  • FanWT
    FanWT FanWT 2023级硕士研究生
    发布于2025-03-14 11:20:58

    金榜题名 | AAMAS 2025 计算经济学挑战赛开始报名!

    金榜题名 “金榜题名”是 RLChina 公众号的一个栏目,发布决策智能相关的竞赛信息。 导读 在现实生活中,税收 和 公共开销 是影响社会经济发展和财富分配的两大核心政策工具。政府需要根据人民的实际情况,动态调整税收与支出政策,以促进经济增长、保障社会公...
    赞 2
    评论
    浏览 661
    学科竞赛
  • 米祈睿
    米祈睿 米祈睿 中科院自动化研究所2021级直博生~
    发布于2024-03-04 10:02:03

    金榜题名 | AAMAS 2024 计算经济学挑战赛开始报名!

    金榜题名 “金榜题名”是 RLChina 公众号的一个栏目,发布决策智能相关的竞赛信息。 导读 ​ 税收与政府购买是塑造社会经济和贫富差距的关键因素。在现实生活中,政府需要灵活调整这两项政策以满足人民的需求。然而,个体追求个人利益,政府又难以准确预测不同家...
    赞 2
    评论
    浏览 973
    学科竞赛
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2023-06-08 20:55:36

    Awesome 论文合集 |如何追踪 MCTS 的前沿动态?来看看 LightZero 旗下的蒙特卡洛树搜索论文合集吧!(1)

    AlphaGo 对李世石五番棋 2016 年 AlphaGo [1] 与李世石的世纪对决可谓是开启了近十年来人工智能技术探索和发展的浪潮。在围棋这一人类最经典优美的智力游戏上,传统的搜索算法往往迷失在浩如烟海的搜索空间中,朴素的神经网络设计也难以捕捉复杂多...
    赞
    评论
    浏览 715
    论文研讨
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2023-06-28 17:49:08

    Awesome 论文合集 |这些基于AI的蛋白质设计的论文,OpenDILab都帮你整理好了!(2)

    随着人工智能技术的发展与深化,AI 在计算生物领域的融合与发展也愈发深入。而蛋白质结构预测则是其中的一项重要工作。 OpenDILab 发布的 repo: Awesome AI-based Protein Design,这个 repo 致力于帮大家收录整理...
    赞
    评论
    浏览 594
    论文研讨
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2023-06-15 15:12:15

    混合动作空间|揭秘创造人工智能的黑魔法(4)

    还记得我们的混合动作空间专栏吗?过去的三篇专栏里,我们介绍了混合动作空间的定义,常见的动作空间预处理方法,并将当前学术界解决混合动作空间的方法总结为以下三类: 基于状态-动作值函数 Q 的方法 基于状态值函数 V 的方法 基于动作空间学习和转换的方法 ...
    赞 2
    评论
    浏览 729
    经验分享
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2023-06-13 12:15:25

    Awesome 论文合集 |如何追踪 MCTS 的前沿动态?来看看 LightZero 旗下的蒙特卡洛树搜索论文合集吧!(2)

    AlphaGo 对李世石五番棋 2016 年 AlphaGo [1] 与李世石的世纪对决可谓是开启了近十年来人工智能技术探索和发展的浪潮。在围棋这一人类最经典优美的智力游戏上,传统的搜索算法往往迷失在浩如烟海的搜索空间中,朴素的神经网络设计也难以捕捉复杂多...
    赞
    评论
    浏览 599
    论文研讨
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-28 14:20:08

    谜题科技引领AI新时代:Enigma Alpha开启全新人工智能生成决策动作篇章!

    近日,上海数字大脑研究院孵化的独立初创企业谜题科技(Enigma Tech.)发布了 AIGA(人工智能生成动作)系统 Enigma Alpha,实现了自然语言对话交互、工具增强的自然语言交互、以自然语言为接口的物理/虚拟世界交互和通用决策 AI App ...
    赞 1
    评论
    浏览 856
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-20 17:51:49

    AIGA时代,决策智能大模型将引领产业变革

    ChatGPT-3 的热度还未过,OpenAI 于近日发布了多模态预训练大模型 GPT-4,行业惊呼又一场颠覆性的变革呼啸而来。对于 AIGC(内容生成)方向来说,变革随着 GPT-3 和 GPT-4 的横空出世已然落定;然而对于 AIGA(行动生成)方向...
    赞
    评论
    浏览 939
    水区
  • 上海数字大脑研究院
    上海数字大脑研究院 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。
    发布于2023-03-14 12:54:16

    ChatGPT和大模型春季课程Day2:上交大副教授与数研院工程师探析大模型及技术原理

    ​RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为专题报告、实践课和话题讨论三个部分。 今晚 19:00-21:...
    赞
    评论
    浏览 844
    课程学习
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-11-30 10:03:07

    当知识图谱遇上预训练语言模型

    知识图谱与语言预训练是什么关系呢? 本文就将从语言预训练模型开始,介绍知识对语言预训练模型的价值,并介绍几个前沿的知识图谱增强语言预训练模型。 01 知识图谱与语言预训练 关于“知识”的话题有两条不同的技术思路。 一条思路认为需要构建知识图谱,利用符号化的...
    赞
    评论
    浏览 1291
    水区
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-05-27 12:51:30

    混合动作空间|揭秘创造人工智能的黑魔法(2)

    引言: 我们之前的一篇文章(混合动作空间 | 揭秘创造人工智能的黑魔法(1))中,详细地介绍了强化学习目前常见的动作空间类型,如离散动作、连续动作、混合动作等。本文则将以游戏环境为例,介绍如何对强化学习的动作空间进行预处理(action space sha...
    赞 1
    评论
    浏览 1254
    经验分享
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-05-16 18:48:02

    混合动作空间|揭秘创造人工智能的黑魔法(1)

    OpenDILab 新开设了混合动作空间专栏,将从离散动作空间和连续动作空间入手,为大家介绍混合动作空间的起源和发展,并解读一系列学术界相关 paper。 本文作为混合动作空间系列专题文章的第一篇,主要是介绍混合动作空间的类型以及经典环境。 近年来,强化学...
    赞 1
    评论
    浏览 1447
    实用工具
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2022-03-09 21:45:50

    可能是最全的 | 适合决策AI研究的自动驾驶模拟器评测(上篇)

    自动驾驶决策 AI 的研究离不开仿真软件,一方面因为自动驾驶的实车测试需要在保证安全的环境中,这使得采用 AI 模型的实验难以开展;另一方面,对大部分研究者来说,实车测试的条件复杂且昂贵,难以满足。 同时,不论是以模仿学习为代表的监督学习算法,还是需要与环...
    赞 3
    评论
    浏览 5860
    实用工具
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2022-02-23 09:37:53

    如何用AI技术增强企业认知智能?超详细架构解读!

    认知的高度决定了创造价值的高度。 企业在从创办、发展、竞争、成功到衰亡的全生命周期中,会面临复杂多样的决策场景。 然而,时代演变产生的海量、分散、实时的信息,仅靠人类个体是难以高效、准确地感知、认知和决策的。 因此,企业需要通过大数据与人工智能技术,提升对...
    赞
    评论
    浏览 1481
    水区
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2022-02-14 09:36:24

    2022年,哪些技术将改变世界?权威报告趋势预测

    【*参照“机器之心”】 弹指之间,2021 年已经远去。这一年,新冠疫情全球经济和社会生活带来诸多挑战,同时,科学技术的力量得以持续显现。技术进步与产业发展的速度进一步加快,数字技术、智能技术为人们的生活带来了更多的想象空间。 站在 2022 年的起点展望...
    赞
    评论
    浏览 880
    水区
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2022-01-17 13:10:10

    人类视觉计算理论经典著作,豆瓣评分9.7,中文版惊鸿面世!

    今天给大家介绍一本豆瓣评分高达 9.7 分、成书于 40 多年前的神书: 这是一本影响一代脑、认知、计算机视觉专家的经典著作! 在计算机视觉领域,本书至少做出了两个重大贡献: 1.提出了视觉研究需要相对独立地考虑包括计算理论、算法和神经实现在内的三个“理...
    赞
    评论
    浏览 968
    水区
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-12-29 16:25:45

    图神经网络在生化医疗方面的相关应用

    预测分子的化学性质和化学反应 在生化领域,药物分子化合物、蛋白质等经常被作为研究对象。以分子为例,它是一个天然的图结构,可以将分子中的原子看作节点,将化学键看作边,研究分子的化学性质就可以看成给一个图分类或者回归问题。事实上,在机器学习图分类问题的标准数据...
    赞 1
    评论
    浏览 908
    水区
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-12-07 09:31:57

    如何正确地运用人工智能模型?

    模型,是客观事物的简化表示! 历史上,每一个伟大模型的提出,都极大地推动了科学和社会的发展,比如历史上出现的 3 个非常有名的模型——万有引力定律、大陆漂移假说、日心说。 在人工智能领域,也有很多模型用来解决现实生活中遇到的千千万万的问题。 我们在现实生活...
    赞
    评论
    浏览 912
    水区
  • 博文视点Broadview
    博文视点Broadview 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!
    发布于2021-12-07 09:30:15

    关于决策树,你一定要知道的知识点!

    在现实生活中,我们每天都会面对各种抉择,例如根据商品的特征和价格决定是否购买。 不同于逻辑回归把所有因素加权求和然后通过 Sigmoid 函数转换成概率进行决策,我们会依次判断各个特征是否满足预设条件,得到最终的决策结果。例如,在购物时,我们会依次判断价格...
    赞
    评论
    浏览 1067
    水区
签到
0
立即签到
合作伙伴 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219

积分排行
  • Carlos
    Carlos

    2 帖子 • 4 评论

    957
  • Frei0d
    Frei0d

    1 帖子 • 9 评论

    900
  • R
    Rlxia

    0 帖子 • 0 评论

    564
  • RLChina
    RLChina

    124 帖子 • 77 评论

    454
  • POLIXIR
    POLIXIR

    44 帖子 • 5 评论

    351
  • Rewrite
    Rewrite

    0 帖子 • 4 评论

    215
  • vinbo
    vinbo

    9 帖子 • 84 评论

    167
  • 支太行
    支太行

    17 帖子 • 34 评论

    133
  • 张海峰
    张海峰

    4 帖子 • 43 评论

    132
  • AINova
    AINova

    20 帖子 • 43 评论

    99
关于 标签 友链