RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
  • 最新
  • 推荐
  • 关注
  • 论文研讨
  • 课程学习
  • 学科竞赛
  • 新闻动态
  • 学术活动
  • 经验分享
  • 产业应用
  • 实用工具
  • 招生招聘
  • 水区
  • 水区
  • 反馈
热门标签
离线强化学习 多智能体强化学习
  • 张伟楠
    张伟楠 张伟楠 上海交通大学副教授,研究强化学习、信息检索。
    发布于9小时前

    上海交通大学强化学习课件

    大家好,我是张伟楠,近期将自己在上海交大 ACM 班和 AI 班讲授的《强化学习》课程的课件公布在了: https://hrl.boyuai.com/slides/ 我第一时间在咱 RLChina 社区吼一声,欢迎各位同学们来看看课件,看看课程视频,顺便《...
    赞 2
    评论
    浏览 11
    课程学习
  • C
    C CCS 这家伙很懒,什么都没留下
    发布于26天前

    金榜题名 | IJCAI 2022-Neural MMO 召集令,一同参加AI华山论剑

    导读 当 AI 智能体不再满足「与人斗其乐无穷」,它的能力极限在哪里呢? 今日,由超参数科技发起,联合学界前沿创新力量麻省理工学院、清华大学深圳国际研究生院,以及数据科学挑战平台 AIcrowd 共同主办的「IJCAI 2022-Neural MMO 海量...
    赞
    评论 2
    浏览 150
    学科竞赛
  • OpenDILab决策智能
    OpenDILab决策智能 OpenDILab决策智能 聚焦科技前沿研究问题,致力于探索下一代人工智能
    发布于2天前

    混合动作空间|揭秘创造人工智能的黑魔法(1)

    OpenDILab 新开设了混合动作空间专栏,将从离散动作空间和连续动作空间入手,为大家介绍混合动作空间的起源和发展,并解读一系列学术界相关 paper。 本文作为混合动作空间系列专题文章的第一篇,主要是介绍混合动作空间的类型以及经典环境。 近年来,强化学...
    赞 1
    评论
    浏览 30
    实用工具
  • H
    H hkb 这家伙很懒,什么都没留下
    发布于8天前
    强化学习做出一个动作后,如果下一个状态的其中一个是未知的可以吗
    赞 2
    评论 9
    浏览 120
    水区
  • W
    W waterhorse 这家伙很懒,什么都没留下
    发布于27天前

    RLChina 论文研讨会第17期(2022.04.26直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由不同的研究团队轮流主持,邀请一线研究人员针对特定论文做交流分享。 第 17 期论文研讨会将由伦敦大学学院冯熙栋同学主持,超参数科技强化学习研究员陈嘉欣、悉尼科技大学博士生许云秋为大家分享最新发表在 AC...
    赞
    评论 2
    浏览 181
    学术活动
  • E
    E EricLiu 这家伙很懒,什么都没留下
    发布于5天前

    RLChina 论文研讨会第18期(2022.05.17直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。第 18 期论文讨论会将由上海交通大学博士研究生刘明桓主持,上海交通大学博士研究生陈竞潇和上海交通大学硕士研究生杨正宇为大...
    赞
    评论
    浏览 93
    学术活动
  • M
    M Minyu 这家伙很懒,什么都没留下
    发布于10天前

    想请教一下为什么maximum entropy(把policy定义成概率密度函数)是有效的

    我是做最优控制的,最近接触到 RL 里把 entropy 加入到目标函数中,同时把 policy 从原来的实值函数变成密度函数,可以做到全局最优。但是针对时间一致的问题,在 RL 中也有提到动态规划原则(DPP),根据 DPP 推导出 Hamilton–J...
    赞 2
    评论 4
    浏览 90
    水区
  • 赵
    赵 赵鉴 这家伙很懒,什么都没留下
    发布于2022-02-11 16:28:32

    RLChina 论文研讨会第11期(2022.02.22直播)

    导读 论文研讨会是 RLChina 举办的学术活动,由 RL 领域不同研究团队轮流担任主持人,邀请一线研究人员针对特定论文做交流分享。第 11 期论文讨论会将由中国科学技术大学博士生赵鉴主持,中国科学技术大学研究生王治海、南京大学研究生刘旭辉和南湖实验室助...
    赞 2
    评论 4
    浏览 438
    学术活动
  • Inspir-AI
    Inspir-AI Inspir-AI hello world~
    发布于9天前

    【启元世界 AI 英雄帖】首个 3D 开放世界 FPS 游戏 AI 竞赛《荒野寻宝》邀你参赛!

    近日,启元世界开发和承办的首个 3D 开放世界 FPS 游戏 AI 竞赛《荒野寻宝》正式启动,该竞赛将在 IEEE Conference on Games 2022 上正式亮相。作为 IEEE CoG 的赞助方,通用人工智能平台公司启元世界(inspir....
    赞
    评论 1
    浏览 87
    学科竞赛
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于7天前

    RLChina 社区发帖获得《动手学强化学习》书籍中奖名单公布

    RLChina 社区发帖赠书活动 自本活动 2022 年 4 月 21 日下午 17 点发布到 2022 年 4 月 30 日上午 12 点活动结束期间,在社区内发布帖子或动态的用户将获得抽奖机会,随机抽取的 10 位用户将各获得《动手学强化学习》书籍一本...
    赞
    评论
    浏览 65
    水区
  • 大鱼
    大鱼 大鱼 这家伙很懒,什么都没留下
    发布于2022-04-06 08:39:45

    分层强化学习

    请教:分层强化学习有什么推荐的综述文章吗?
    赞
    评论 1
    浏览 133
    经验分享
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于11天前

    RLChina 前沿讲习班第7期——棋牌游戏专题

    导读 前沿讲习班是 RLChina 举办的学术活动,每期就某一研究话题邀请若干位专家作线上报告,并组织感兴趣的同学交流研讨。第 7 期前沿讲习班的话题是棋牌游戏,将由北京大学李文新老师和清华大学兴军亮老师为大家分享最新的研究进展,欢迎大家参与。互动方式:在...
    赞
    评论
    浏览 111
    学术活动
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于11天前

    金榜题名 | AI奥林匹克竞赛,十万奖金池等你来战,报名参与抽奖赠书

    导读 “AI 奥林匹克竞赛”与顶级人工智能学术会议 WAIC 2022 和 IJCAI-ECAI 2022 合作,邀请参赛者研发一个能够参与多项奥林匹克运动的 AI,旨在推动通用决策智能体的研究。两个阶段的比赛正在火热报名中,快来报名参与抽奖赠书的活动吧!...
    赞
    评论
    浏览 53
    学科竞赛
  • RLChina
    RLChina RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
    发布于11天前

    金榜题名 | 顶会竞赛,一起玩转AI奥林匹克

    导读 如何使一个智能体在多个任务中表现得游刃有余?如何使智能体更具有泛化性?“AI 奥林匹克”系列竞赛向参赛者发起挑战!竞赛邀请参赛者研发一个 AI 参与多个奥林匹克运动项目,合力推动具有泛化性的智能体研究。多元有趣的赛题场景,丰富的优胜奖励,顶级学术会议...
    赞
    评论
    浏览 67
    学科竞赛
  • 赵祉瑜
    赵祉瑜 赵祉瑜 本科北京理工大学,中科院自动化所硕士
    发布于12天前

    前沿追踪 | 强化学习月度十大动态 2204 期:谷歌研究RL初始化问题,CMU与DEE将离线蒸馏技术应用在机器人终身学习等

    导读 本推文整理了 2022 年 4 月强化学习十大学术动态,涵盖强化学习相关领域的论文、会议、教程、观点等内容,全面覆盖 RL theory,multi-agent RL,imitation RL,offline RL,Hierarchical RL,R...
    赞
    评论
    浏览 132
    新闻动态
  • 漂流萍
    漂流萍 漂流萍 流体力学+强化学习,USTCer
    发布于20天前

    强化学习的动作空间是离散-连续混合,而且周期决策,应该如何实现?

    各位老师同学,跨领域学习,所以问的问题可能拙略请见谅。 目前所希望做的是,控制一个周期拍动的翼型,每个周期结束时可选择的动作空间为有限个拍动幅值(离散空间),然后在每个周期内等时间间隔上,又需要控制翼型的角度(连续空间)?分层强化学习可以处理这样的问题吗?
    赞
    评论 3
    浏览 90
    水区
  • 张晨珩
    张晨珩 张晨珩 南开大学AI本科生
    发布于17天前

    多样性PSRO:Towards Unifying Behavioral and Response Diversity for Open-ended Learning in Zero-sum Games

    记得之前读过 DeepMind 团队的大作 Real World Games Look Like Spinning Tops,大佬们指出 Real World Games 的策略空间往往像一个陀螺,我们想找到一个好的策略,必须要翻过中间的红色区域。然而这红...
    赞 1
    评论
    浏览 70
    论文研讨
  • 张晨珩
    张晨珩 张晨珩 南开大学AI本科生
    发布于17天前

    PSRO基本框架:A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning

    这篇文章是 PSRO 框架的开山之作。由于笔者之前一直在做单 agent 强化学习,最近才开始接触 MARL,读了几遍都觉得云里雾里,于是一怒之下啃了一遍博弈论教程,总算是自我感觉理解了大部分内容。将自己的浅显理解整理于此,若有疏漏还望海涵。 原文传送门:...
    赞 2
    评论
    浏览 83
    论文研讨
  • 张晨珩
    张晨珩 张晨珩 南开大学AI本科生
    发布于17天前

    生活就像陀螺,抽打永不停息:Real World Games Look Like Spinning Tops

    最近一直在 coding,趁着模型训练的空闲,总算有时间细品这篇垂涎已久的 paper。在之前的笔记多样性 PSRO 中已经提到过其中部分内容,这次来仔细领略一下 DeepMind 大佬们高屋建瓴的思维。 原文传送门:Real World Games Lo...
    赞 2
    评论
    浏览 79
    论文研讨
  • dandan
    dandan dandan 研二在读,边缘计算,强化学习 加油冲啊
    发布于2021-10-08 14:26:42
    有没有小伙伴在看边缘计算中卸载决策和资源分配的文章,关于多智体分散决策的 可以一块交流讨论呀
    赞 3
    评论 8
    浏览 340
    论文研讨
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 强化学习暑期课(每年):http://rlchina.org/topic/9

三、RLChina 智能体挑战赛(每季):http://rlchina.org/topic/216

四、RLChina 前沿讲习班(每月):http://rlchina.org/topic/215

五、RLChina 论文研讨会(每周):http://rlchina.org/topic/219

签到
0
立即签到
积分排行
  • RLChina
    RLChina

    59 帖子 • 49 评论

    255
  • Carlos
    Carlos

    2 帖子 • 2 评论

    207
  • Rewrite
    Rewrite

    0 帖子 • 1 评论

    133
  • 支太行
    支太行

    17 帖子 • 34 评论

    131
  • POLIXIR
    POLIXIR

    13 帖子 • 2 评论

    120
  • 张海峰
    张海峰

    4 帖子 • 32 评论

    116
  • AINova
    AINova

    19 帖子 • 38 评论

    85
  • daydayup
    daydayup

    4 帖子 • 33 评论

    82
  • vinbo
    vinbo

    6 帖子 • 32 评论

    82
  • 从头再来
    从头再来

    14 帖子 • 41 评论

    80
友情链接 查看更多>>
  • 及第

    中科院自动化所多智能体开源开放平台

  • 动手学强化学习

    上海交大强化学习课程材料

关于 标签 友链
© 2021 Powered by 中国科学院自动化研究所群体决策智能实验室