张晨珩

南开大学19级AI本科生

张晨珩南开大学19级AI本科生

发布于2022-06-15 22:23:56

【RL in Robotics】Sim-to-Real Transfer
需要做一些 RL in Robotics 的调研，所以近期打算读一些相关文献，于此稍加记录。一、问题引入目前，DRL 已经在机器人领域取得了相当大的成功。机器人不同于其他领域（游戏、围棋等），机器人是要用于真实世界的，因此会有很多额外的限制。 RL 本...

赞 3

评论

浏览 1708

论文研讨
张晨珩南开大学19级AI本科生

发布于2022-05-19 17:56:29

论文考古 | 从一个棋手的角度来看AlphaGo系列
组会上偶然间提起 AlphaGo，勾起了一些尘封已久的记忆。说起来，我之所以选择 AI 这个专业、确定 RL 这个方向，与 AlphaGo 不无关系。曾经的我满怀对围棋的梦想，也算是有点天赋吧，不足十岁就已经获得过多次省级冠亚军，正打算中考之后去聂道场进...

赞 3

评论 1

浏览 1222

论文研讨
张晨珩南开大学19级AI本科生

发布于2022-05-02 00:08:47

多样性PSRO：Towards Unifying Behavioral and Response Diversity for Open-ended Learning in Zero-sum Games
记得之前读过 DeepMind 团队的大作 Real World Games Look Like Spinning Tops，大佬们指出 Real World Games 的策略空间往往像一个陀螺，我们想找到一个好的策略，必须要翻过中间的红色区域。然而这红...

赞 2

评论

浏览 1437

论文研讨
张晨珩南开大学19级AI本科生

发布于2022-05-01 23:57:52

PSRO基本框架：A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning
这篇文章是 PSRO 框架的开山之作。由于笔者之前一直在做单 agent 强化学习，最近才开始接触 MARL，读了几遍都觉得云里雾里，于是一怒之下啃了一遍博弈论教程，总算是自我感觉理解了大部分内容。将自己的浅显理解整理于此，若有疏漏还望海涵。原文传送门：...

赞 3

评论

浏览 1990

论文研讨
张晨珩南开大学19级AI本科生

发布于2022-05-01 23:33:41

生活就像陀螺，抽打永不停息：Real World Games Look Like Spinning Tops
最近一直在 coding，趁着模型训练的空闲，总算有时间细品这篇垂涎已久的 paper。在之前的笔记多样性 PSRO 中已经提到过其中部分内容，这次来仔细领略一下 DeepMind 大佬们高屋建瓴的思维。原文传送门：Real World Games Lo...

赞 2

评论

浏览 1372

论文研讨