RLChina 2024 SCHEDULE





RLChina 2024 会议日程安排
大会第1天(10 月 12 日)
时间主题地点
09:00-09:30
开幕式
主持人:张海峰(中国科学院自动化研究所)
演讲厅A
09:30-12:30
主旨报告 1
报告题目:Data Science For Deep Learning
报告人: 陈雷(香港科技大学(广州))
主旨报告 2
报告题目:具身智能赋能产业发展
报告人: 孙富春(清华大学)
主旨报告 3
报告题目: LLM and AI Agents: A Roadmap and Vision Towards AGI
报告人:汪军 (伦敦大学学院)
12:30-14:00
午休
14:00-18:00
Workshop 1:强化学习前沿
主持人:俞扬(南京大学)
CMA Lab多功能区域
报告题目: 强化学习:从理论迈向实际——聚焦Safe RL和Offline RL
报告人: 魏巍(山西大学)
报告题目: 面向长序列复杂任务的操作技能学习与规划
报告人: 李斯源 (哈尔滨工业大学)
报告题目: 面向开放环境的协作多智能体强化学习方法
报告人: 袁雷 (南京大学)
报告题目: Information-Directed Sampling: A Provably Sample-Efficient Approach for Decision-Making Problems
报告人: 张乔生(上海人工智能实验室)
报告题目: 强化学习的产业化探索
报告人: 赵鉴(南栖仙策)
Panel Discussion
14:00-18:00
Workshop 2:智能体创新应用
主持人:郝建业(华为诺亚方舟实验室)
演讲厅B
报告题目: AI Agent业界进展和发展趋势
报告人: 张长旺 (OPPO研究院)
报告题目: 离线强化学习视角下的决策智能
报告人: 马亿(山西大学)
报告题目: 从强化学习(多)智能体到大语言模型(多)智能体
报告人:毛航宇(快手科技)
报告题目:Emergence of Social Norms in Generative Agent Societies: Principles and Architecture
报告人: 胡舒悦 (上海人工智能实验室)
报告题目: (M)LLM-based Smartphone Agents: Benchmarking, Offline Finetuning and Online Optimization
报告人:邵坤 (华为诺亚方舟实验室)
报告题目: 大模型智能体的高效推理与自主优化机制研究
报告人:徐丰力 (清华大学)
报告题目: 决策智能在油气行业生产经营领域中的探索和应用
报告人:孙亮(中国石油规划总院)
Panel Discussion
14:00-18:00
Workshop 3:多智能体合作与博弈
主持人: 余超(中山大学)
C2-102
报告题目: 大规模复杂博弈智能决策
报告人:王轩(哈尔滨工业大学)
报告题目: 博弈驱动的动态杀伤网敏捷构建关键技术
报告人: 王震 (西北工业大学)
报告题目: 世界模型驱动的机器人自主学习与协同决策理论及应用
报告人: 兰旭光 (西安交通大学)
报告题目: 多智能体高效合作学习
报告人: 张俊格 (中国科学院自动化研究所)
报告题目: 多智能体团队零和博弈强化学习研究和实体无人系统应用
报告人:朱圆恒 (中国科学院自动化研究所)
报告题目: 群体智能决策——算法、平台与应用
报告人:陈晨 (启元实验室智能基础理论研究中心)
Panel Discussion
14:00-18:00
Workshop 4:大模型与智能体
主持人: 刘鹏飞(上海交通大学)
N+荟馆三楼路演厅
报告题目: 人形机器人智能体
报告人: 戈维峰 (复旦大学)
报告题目: 面向复杂任务的多智能体协同方法
报告人: 高莘 (电子科技大学)
报告题目: 大语言模型优化中的强化学习回顾及实践
报告人: 王维埙(阿里巴巴)
报告题目: SALMONN系列音视频大模型研发进展
报告人: 张超 (清华大学)
报告题目: Training Agents with LLMs: Harnessing AI to Train AI
报告人: 王露(微软亚洲研究院)
报告题目: 大语言模型的高效计算
报告人: 林洲汉(上海交通大学)
Panel Discussion

大会第2天(10 月 13 日)
时间内容地点
09:00-12:30
Workshop 5:决策智能理论
主持人: 汪军(伦敦大学学院)、 滕佳烨 (上海财经大学)
演讲厅B
报告题目: 检索增强(RAG)能提升大模型的推理能力吗?
报告人:刘勇 (中国人民大学)
报告题目:Combinatorial Multivariant Multi-Armed Bandits with Applications to Episodic Reinforcement Learning and Beyond
报告人: 李帅 (上海交通大学)
报告题目: Two-way Deconfounder for Off-policy Evaluation under Unmeasured Confounding
报告人: 周帆(上海财经大学)
报告题目: 匹配市场中的多臂赌博机算法
报告人: 孔芳(南方科技大学)
报告题目: Actions Speak What You Want: Provably Sample-Efficient Reinforcement Learning of the Quantal Stackelberg Equilibrium from Strategic Feedbacks
报告人: 陈思宇(耶鲁大学)
Panel Discussion
09:00-12:30
Workshop 6:智能体训练系统与仿真环境
主持人: 温颖(上海交通大学)
演讲厅C
报告题目: 用于通用计算机控制的AI Agent框架Cradle
报告人: 安波(新加坡南洋理工大学)
报告题目:面向城市具身智能的仿真环境与大模型智能体
报告人:高宸 (清华大学)
报告题目: 面向智能无人系统的软硬件跨层次优化技术
报告人:余金城 (清华大学)
报告题目: 可控扩散模型驱动的智能体生成与决策
报告人: 石野(上海科技大学)
Panel Discussion
09:00-12:30
Workshop 7:智能体的价值对齐与安全鲁棒
主持人:张倬胜(上海交通大学)
E4-102
报告题目: 智能体-人类-环境统一对齐原则初探
报告人:李鹏 (清华大学)
报告题目:大模型能力对齐
报告人:桂韬(复旦大学)
报告题目:Towards Robust, Efficient and Practical Decision Making: From Reward-Maximizing Deep Reinforcement Learning to Reward-Matching GFlowNets
报告人:潘玲(香港科技大学)
报告题目:大模型驱动的端侧智能体
报告人:陈露 (上海交通大学)
Panel Discussion
09:00-12:30
Workshop 8:计算经济学
主持人: 沈蔚然(中国人民大学)
W1-101
报告题目: 大规模经济中的最优税制设计
报告人: 朱胜豪(对外经济贸易大学)
报告题目: MMS Allocation of Indivisible Chores with Subadditive Valuations and the Fair Surveillance Assignment Problem
报告人:李博(香港理工大学)
报告题目: Incentives for Early Arrival in Cooperative Games
报告人:赵登吉(上海科技大学)
报告题目: Fairness in Facility Location Games
报告人:李闽溟(香港城市大学)
Panel Discussion
12:30-14:00
学术海报交流
E2-E3二楼连廊
14:00-18:00
Workshop 9:具身智能与机器人
主持人:高阳 (清华大学)、 刘乃军(中国科学院自动化研究所)
演讲厅C
报告题目: 大模型与群体智能决策
报告人: 蒲志强(中国科学院自动化研究所)
报告题目: 人形/四足机器人感控一体强化学习技术研究
报告人: 朱秋国(浙江大学)
报告题目: 可泛化强化学习和具身应用
报告人:白辰甲 (中国电信人工智能研究院)
报告题目: 基于机器学习的无人机智能控制
报告人:潘为 (曼彻斯特大学)
Panel Discussion
14:00-18:00
Workshop 10:智能体跨学科交叉
主持人:崔颖 (香港科技大学(广州))
E4-102
报告题目: 在AI时代激励每个学生幸福成长
报告人: 杨旸(香港科技大学(广州))
报告题目: Beautimeter: 利用GPT技术进行自我镜像测试,评估建筑和城市之美
报告人:江斌 (香港科技大学(广州))
报告题目: 6G:从连接泛在到智慧泛在
报告人:陈天骄(中国移动研究院)
报告题目: 深度学习及大语言模型在基因组和生物数据分析中的应用
报告人: 张延林(香港科技大学(广州))
Panel Discussion
14:00-18:00
Workshop 11:智能运筹优化
主持人:张一帆(中国科学院自动化研究所)
演讲厅B
报告题目: 离散优化问题的人工智能方法
报告人: 严骏驰(上海交通大学)
报告题目: Atomic Dynamic Flow Games: Adaptive vs. Nonadaptive Agents
报告人: 王长军 (中国科学院数学与系统科学研究院)
报告题目:数智驱动的图上组合优化问题学习型求解技术
报告人: 范长俊(国防科技大学)
报告题目: 工业决策智能:从启发式走向大模型
报告人:王杰 (中国科学技术大学)
报告题目: MindOpt优化求解技术与应用进展
报告人:王孟昌 (阿里达摩院)
报告题目: 如何让大语言模型协助经典智能规划
报告人:卓汉逵(中山大学)

大会第3-7天(10 月 14 - 18 日)
时间 10月14日 10月15日 10月16日 10月17日 10月18日
9:30-12:30 机器学习
基础大模型
强化学习
多智能体
具身智能
14:30-17:30 基础大模型
大模型实践
强化学习实践
大模型智能体
具身智能实践
地点 N+荟馆三楼路演厅 N+荟馆三楼路演厅 演讲厅B 演讲厅B N+荟馆三楼路演厅
授课团队 授课团队由汪军老师领衔,联合伦敦大学学院、上海交通大学、中国科学院自动化研究所、华为诺亚实验室、腾讯开悟平台等高校和企业专家组成
10 月 14 日
时间内容地点
19:00-22:00
决策智能创业分享会
主持人: 汪军(伦敦大学学院)
C2-102
报告题目: 当科学家成为创业者:创业路上的挑战与机遇
报告人:刘元 (真格基金)
报告题目: 从数据出发,开启AI无限可能
报告人: 周卉章(上海尖晶投资有限公司)
报告题目: 穹彻智能的具身智能实践
报告人: 王竞凡 (上海穹彻智能科技有限公司)
报告题目: 以GenAI技术赋能城市建设与运维:我的创业探索
报告人: 张攀(墨力云智能)
报告题目: 对话即商业:Gen AI x Conversation AI的创业机遇与挑战
报告人: Linda Jiang(Neurowave)
报告题目: AI music for all mankind
报告人: 夏雨(小叶子音乐科技)
报告题目: 智能软件维护的未来:利用大模型驱动提升软件质量与效率
报告人: 李凌波(无限思维科技有限公司)
报告题目: 创投如何赋能人工智能
报告人: 董和瀚(戈壁创投)
10 月 17 日
时间内容地点
19:00-20:00
Workshop 10:智能体跨学科交叉
主持人: 崔颖 (香港科技大学(广州))
演讲厅B
报告题目: 转变路径:人类旅行行为演变背后的理论
报告人:Frank Witlox (根特大学)