RLChina 强化学习社区
发表
发动态
发帖子
登录/注册
首页
话题
发动态
发帖子
消息
登录/注册
最新
推荐
关注
张
张晨珩
南开大学19级AI本科生
个人成就
积分
18
帖子
5
评论
1
注册排名
597
关注了
8
关注者
3
帖子
文章
张
张
张晨珩
南开大学19级AI本科生
发布于2022-06-15 14:23:56
【RL in Robotics】Sim-to-Real Transfer
需要做一些 RL in Robotics 的调研,所以近期打算读一些相关文献,于此稍加记录。 一、问题引入 目前,DRL 已经在机器人领域取得了相当大的成功。机器人不同于其他领域(游戏、围棋等),机器人是要用于真实世界的,因此会有很多额外的限制。 RL 本...
赞
3
评论
浏览
1452
论文研讨
张
张
张晨珩
南开大学19级AI本科生
发布于2022-05-19 09:56:29
论文考古 | 从一个棋手的角度来看AlphaGo系列
组会上偶然间提起 AlphaGo,勾起了一些尘封已久的记忆。说起来,我之所以选择 AI 这个专业、确定 RL 这个方向,与 AlphaGo 不无关系。 曾经的我满怀对围棋的梦想,也算是有点天赋吧,不足十岁就已经获得过多次省级冠亚军,正打算中考之后去聂道场进...
赞
3
评论
1
浏览
1148
论文研讨
张
张
张晨珩
南开大学19级AI本科生
发布于2022-05-01 16:08:47
多样性PSRO:Towards Unifying Behavioral and Response Diversity for Open-ended Learning in Zero-sum Games
记得之前读过 DeepMind 团队的大作 Real World Games Look Like Spinning Tops,大佬们指出 Real World Games 的策略空间往往像一个陀螺,我们想找到一个好的策略,必须要翻过中间的红色区域。然而这红...
赞
2
评论
浏览
1331
论文研讨
张
张
张晨珩
南开大学19级AI本科生
发布于2022-05-01 15:57:52
PSRO基本框架:A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning
这篇文章是 PSRO 框架的开山之作。由于笔者之前一直在做单 agent 强化学习,最近才开始接触 MARL,读了几遍都觉得云里雾里,于是一怒之下啃了一遍博弈论教程,总算是自我感觉理解了大部分内容。将自己的浅显理解整理于此,若有疏漏还望海涵。 原文传送门:...
赞
3
评论
浏览
1856
论文研讨
张
张
张晨珩
南开大学19级AI本科生
发布于2022-05-01 15:33:41
生活就像陀螺,抽打永不停息:Real World Games Look Like Spinning Tops
最近一直在 coding,趁着模型训练的空闲,总算有时间细品这篇垂涎已久的 paper。在之前的笔记多样性 PSRO 中已经提到过其中部分内容,这次来仔细领略一下 DeepMind 大佬们高屋建瓴的思维。 原文传送门:Real World Games Lo...
赞
2
评论
浏览
1283
论文研讨
到底啦