RLChina 2023 TUTORIAL

Tutorial Speakers
讲者介绍
方蒙
利物浦大学
课件下载 视频回放
方蒙,英国利物浦大学助理教授(博导),荷兰埃因霍温理工大学访问助理教授。他的研究重点是通过语言增强智能体和智能系统,使其能够在现实世界中理解和与人类互动,包括语言理解、推理和决策能力。他的主要研究领域包括自然语言处理以及强化学习/机器学习。他在NLP和AI方向国际顶级会议和期刊上发表论文40多篇。多次获得国际会议的最佳论文和提名,他的工作曾获得图学习会议LoG-2022最佳论文奖等。
报告主题: Generative AI: NLP
这门课程涵盖生成式人工智能的基本原理和应用开发的关键方面。它面向所有人开放,不论技术背景如何,覆盖科学、工程、人文学科和艺术等领域。在学习过程中,您将了解生成式人工智能的定义、能力和限制,深入了解其技术运作和对各行业的潜在影响,以及如何最有效地利用这项技术。除此之外,课程还将系统介绍生成式人工智能的基础知识,探索其原则和应用开发,通过打造个人的生成式人工智能系统来深入学习,真正理解创新理念的实现过程。
杜雅丽
伦敦国王学院
课件下载 视频回放
杜雅丽,伦敦大学国王学院助理教授。担任人工智能合作实验室的负责人。此前她是伦敦大学学院多智能体学习团队博士后研究员,于2019年获悉尼科技大学博士学位。主要研究兴趣为机器学习、强化学习及其在游戏AI、推荐检索和传统控制问题中的应用。目前主要从事强化学习、多智能体学习、策略评估等方面研究,包括合作博弈 (Cooperative Games) 中的奖励分配、通信、动作协调,一般和博弈(general sum game)的学习算法,强化学习泛化性,以及在 游戏AI、数据科学等领域的应用。获得2023年AAAI新教师亮点奖和2023年人工智能领域的新星奖。担任AAMAS 和 IEEE Transactions on AI编辑,并是AAMAS 2023组织委员会的成员。相关研究成果已广泛发表在机器学习的顶会 ICLR、ICML、NeurIPS、IJCAI、AAMAS、WWW等刊物。
报告主题: Cooperation in Multi-Agent Learning
多智体学习(MAL)中的合作是众多学科的交汇点,包括博弈论、经济学、社会科学和进化生物学,旨在理解战略互动、合作和竞争。随着对合作人工智能的需求越来越被广泛认可和迫切需要,这个主题变得越来越重要。这一点尤其重要,因为正在开发更具能力的智能体,它们利用大型基础模型。在本文中,我们将概述多智体学习的概念、基础和算法。这将包括强化学习的基础知识、多智体顺序决策制定、与多智体合作相关的挑战,以及对最近进展的全面审查,以及相关指标的评估。此外,我们将就这一领域的开放性挑战展开讨论,旨在激发新的研究方向。
张伟楠
上海交通大学
课件下载 视频回放
张伟楠博士现任上海交通大学计算机系长聘副教授、博士生导师,科研领域包括强化学习和数据科学,相关的研究成果在国际会议和期刊上发表180余篇学术论文,谷歌学术引用1万余次,获得5个最佳论文奖项,出版教材《动手学强化学习》和《动手学机器学习》。张伟楠长期担任NeurIPS、ICML、ICLR、KDD、AAAI、IJCAI、SIGIR等会议的领域主席和TPAMI、FCS等期刊的编委,作为负责人承担国家自然科学基金优秀青年项目和科技部2030新一代人工智能重大项目课题,入选中国科协青年人才托举工程和上海市科委英才扬帆计划,获得吴文俊人工智能优秀青年奖和达摩院青橙奖。张伟楠于2011年获得上海交通大学计算机系ACM班学士学位,于2016年获得伦敦大学学院计算机系博士学位。
报告主题: 强化学习入门
本次教学报告为RLChina会议的保留环节,即为广大强化学习初学者提供一个入门教程。本次教学报告基于《动手学强化学习》,其中的教学内容包括决策智能概念、强化学习基本思想、马尔可夫决策过程、动态规划、无模型的强化学习、基于规划的强化学习、近似价值函数、策略梯度、Actor-Critic、深度强化学习入门、深度价值函数、深度策略方法等。
杨梦月
伦敦大学学院
课件下载 视频回放
杨梦月,伦敦大学学院(UCL)博士在读,导师是汪军教授。研究兴趣包括因果表示学习、强化学习和推荐系统,在机器学习领域的顶级会议和期刊上发表多篇一作研究成果。主页:https://ymy4323460.github.io/。
报告主题: Causality For Decision Making
因果学习一直以来被看作是可解释性机器学习的重要方向,能够有效的增强强化学习的性能,算法的鲁棒性和泛化能力。我们将在本次的报告中介绍因果的基本知识,探索如何使用因果推理理解环境知识,借助因果进行强化学习决策。