RLChina 2024

时间	主题	地点
09:00-09:30	开幕式主持人：张海峰（中国科学院自动化研究所）	演讲厅A
09:30-12:30	主旨报告 1 报告题目：Data Science For Deep Learning 报告人：陈雷（香港科技大学（广州））
主旨报告 2 报告题目：具身智能赋能产业发展报告人：孙富春（清华大学）
主旨报告 3 报告题目： LLM and AI Agents: A Roadmap and Vision Towards AGI 报告人：汪军（伦敦大学学院）
12:30-14:00	午休
14:00-18:00	Workshop 1：强化学习前沿主持人：俞扬（南京大学）	CMA Lab多功能区域
报告题目：强化学习：从理论迈向实际——聚焦Safe RL和Offline RL 报告人：魏巍（山西大学）
报告题目：面向长序列复杂任务的操作技能学习与规划报告人：李斯源（哈尔滨工业大学）
报告题目：面向开放环境的协作多智能体强化学习方法报告人：袁雷（南京大学）
报告题目： Information-Directed Sampling: A Provably Sample-Efficient Approach for Decision-Making Problems 报告人：张乔生（上海人工智能实验室）
报告题目：强化学习的产业化探索报告人：赵鉴（南栖仙策）
Panel Discussion
14:00-18:00	Workshop 2：智能体创新应用主持人：郝建业（华为诺亚方舟实验室）	演讲厅B
报告题目： AI Agent业界进展和发展趋势报告人：张长旺（OPPO研究院）
报告题目：离线强化学习视角下的决策智能报告人：马亿（山西大学）
报告题目：从强化学习(多)智能体到大语言模型(多)智能体报告人：毛航宇（快手科技）
报告题目：Emergence of Social Norms in Generative Agent Societies: Principles and Architecture 报告人：胡舒悦（上海人工智能实验室）
报告题目： (M)LLM-based Smartphone Agents: Benchmarking, Offline Finetuning and Online Optimization 报告人：邵坤（华为诺亚方舟实验室）
报告题目：大模型智能体的高效推理与自主优化机制研究报告人：徐丰力（清华大学）
报告题目：决策智能在油气行业生产经营领域中的探索和应用报告人：孙亮（中国石油规划总院）
Panel Discussion
14:00-18:00	Workshop 3：多智能体合作与博弈主持人：余超（中山大学）	C2-102
报告题目：大规模复杂博弈智能决策报告人：王轩（哈尔滨工业大学）
报告题目：博弈驱动的动态杀伤网敏捷构建关键技术报告人：王震（西北工业大学）
报告题目：世界模型驱动的机器人自主学习与协同决策理论及应用报告人：兰旭光（西安交通大学）
报告题目：多智能体高效合作学习报告人：张俊格（中国科学院自动化研究所）
报告题目：多智能体团队零和博弈强化学习研究和实体无人系统应用报告人：朱圆恒（中国科学院自动化研究所）
报告题目：群体智能决策——算法、平台与应用报告人：陈晨（启元实验室智能基础理论研究中心）
Panel Discussion
14:00-18:00	Workshop 4：大模型与智能体主持人：刘鹏飞（上海交通大学）	N+荟馆三楼路演厅
报告题目：人形机器人智能体报告人：戈维峰（复旦大学）
报告题目：面向复杂任务的多智能体协同方法报告人：高莘（电子科技大学）
报告题目：大语言模型优化中的强化学习回顾及实践报告人：王维埙（阿里巴巴）
报告题目： SALMONN系列音视频大模型研发进展报告人：张超（清华大学）
报告题目： Training Agents with LLMs: Harnessing AI to Train AI 报告人：王露（微软亚洲研究院）
报告题目：大语言模型的高效计算报告人：林洲汉（上海交通大学）
Panel Discussion

时间

主题

地点

09:00-09:30

开幕式

主持人：张海峰（中国科学院自动化研究所）

演讲厅A

09:30-12:30

主旨报告 1

报告题目：Data Science For Deep Learning

报告人：陈雷（香港科技大学（广州））

主旨报告 2

报告题目：具身智能赋能产业发展

报告人：孙富春（清华大学）

主旨报告 3

报告题目： LLM and AI Agents: A Roadmap and Vision Towards AGI

报告人：汪军（伦敦大学学院）

12:30-14:00

午休

14:00-18:00

Workshop 1：强化学习前沿

主持人：俞扬（南京大学）

CMA Lab多功能区域

报告题目：强化学习：从理论迈向实际——聚焦Safe RL和Offline RL

报告人：魏巍（山西大学）

报告题目：面向长序列复杂任务的操作技能学习与规划

报告人：李斯源（哈尔滨工业大学）

报告题目：面向开放环境的协作多智能体强化学习方法

报告人：袁雷（南京大学）

报告题目： Information-Directed Sampling: A Provably Sample-Efficient Approach for Decision-Making Problems

报告人：张乔生（上海人工智能实验室）

报告题目：强化学习的产业化探索

报告人：赵鉴（南栖仙策）

Panel Discussion

14:00-18:00

Workshop 2：智能体创新应用

主持人：郝建业（华为诺亚方舟实验室）

演讲厅B

报告题目： AI Agent业界进展和发展趋势

报告人：张长旺（OPPO研究院）

报告题目：离线强化学习视角下的决策智能

报告人：马亿（山西大学）

报告题目：从强化学习(多)智能体到大语言模型(多)智能体

报告人：毛航宇（快手科技）

报告题目：Emergence of Social Norms in Generative Agent Societies: Principles and Architecture

报告人：胡舒悦（上海人工智能实验室）

报告题目： (M)LLM-based Smartphone Agents: Benchmarking, Offline Finetuning and Online Optimization

报告人：邵坤（华为诺亚方舟实验室）

报告题目：大模型智能体的高效推理与自主优化机制研究

报告人：徐丰力（清华大学）

报告题目：决策智能在油气行业生产经营领域中的探索和应用

报告人：孙亮（中国石油规划总院）

Panel Discussion

14:00-18:00

Workshop 3：多智能体合作与博弈

主持人：余超（中山大学）

C2-102

报告题目：大规模复杂博弈智能决策

报告人：王轩（哈尔滨工业大学）

报告题目：博弈驱动的动态杀伤网敏捷构建关键技术

报告人：王震（西北工业大学）

报告题目：世界模型驱动的机器人自主学习与协同决策理论及应用

报告人：兰旭光（西安交通大学）

报告题目：多智能体高效合作学习

报告人：张俊格（中国科学院自动化研究所）

报告题目：多智能体团队零和博弈强化学习研究和实体无人系统应用

报告人：朱圆恒（中国科学院自动化研究所）

报告题目：群体智能决策——算法、平台与应用

报告人：陈晨（启元实验室智能基础理论研究中心）

Panel Discussion

14:00-18:00

Workshop 4：大模型与智能体

主持人：刘鹏飞（上海交通大学）

N+荟馆三楼路演厅

报告题目：人形机器人智能体

报告人：戈维峰（复旦大学）

报告题目：面向复杂任务的多智能体协同方法

报告人：高莘（电子科技大学）

报告题目：大语言模型优化中的强化学习回顾及实践

报告人：王维埙（阿里巴巴）

报告题目： SALMONN系列音视频大模型研发进展

报告人：张超（清华大学）

报告题目： Training Agents with LLMs: Harnessing AI to Train AI

报告人：王露（微软亚洲研究院）

报告题目：大语言模型的高效计算

报告人：林洲汉（上海交通大学）

Panel Discussion

大会第2天（10 月 13 日）

时间	内容	地点
09:00-12:30	Workshop 5：决策智能理论主持人：汪军（伦敦大学学院）、滕佳烨（上海财经大学）	演讲厅B
	报告题目：检索增强（RAG）能提升大模型的推理能力吗？报告人：刘勇（中国人民大学）
	报告题目：Combinatorial Multivariant Multi-Armed Bandits with Applications to Episodic Reinforcement Learning and Beyond 报告人：李帅（上海交通大学）
	报告题目： Two-way Deconfounder for Off-policy Evaluation under Unmeasured Confounding 报告人：周帆（上海财经大学）
	报告题目：匹配市场中的多臂赌博机算法报告人：孔芳（南方科技大学）
	报告题目： Actions Speak What You Want: Provably Sample-Efficient Reinforcement Learning of the Quantal Stackelberg Equilibrium from Strategic Feedbacks 报告人：陈思宇（耶鲁大学）
	Panel Discussion
09:00-12:30	Workshop 6：智能体训练系统与仿真环境主持人：温颖（上海交通大学）	演讲厅C
	报告题目：用于通用计算机控制的AI Agent框架Cradle 报告人：安波（新加坡南洋理工大学）
	报告题目：面向城市具身智能的仿真环境与大模型智能体报告人：高宸（清华大学）
	报告题目：面向智能无人系统的软硬件跨层次优化技术报告人：余金城（清华大学）
	报告题目：可控扩散模型驱动的智能体生成与决策报告人：石野（上海科技大学）
	Panel Discussion
09:00-12:30	Workshop 7：智能体的价值对齐与安全鲁棒主持人：张倬胜（上海交通大学）	E4-102
	报告题目：智能体-人类-环境统一对齐原则初探报告人：李鹏（清华大学）
	报告题目：大模型能力对齐报告人：桂韬（复旦大学）
	报告题目：Towards Robust, Efficient and Practical Decision Making: From Reward-Maximizing Deep Reinforcement Learning to Reward-Matching GFlowNets 报告人：潘玲（香港科技大学）
	报告题目：大模型驱动的端侧智能体报告人：陈露（上海交通大学）
	Panel Discussion
09:00-12:30	Workshop 8：计算经济学主持人：沈蔚然（中国人民大学）	W1-101
	报告题目：大规模经济中的最优税制设计报告人：朱胜豪（对外经济贸易大学）
	报告题目： MMS Allocation of Indivisible Chores with Subadditive Valuations and the Fair Surveillance Assignment Problem 报告人：李博（香港理工大学）
	报告题目： Incentives for Early Arrival in Cooperative Games 报告人：赵登吉（上海科技大学）
	报告题目： Fairness in Facility Location Games 报告人：李闽溟（香港城市大学）
	Panel Discussion
12:30-14:00	学术海报交流	E2-E3二楼连廊
14:00-18:00	Workshop 9：具身智能与机器人主持人：高阳（清华大学）、刘乃军（中国科学院自动化研究所）	演讲厅C
	报告题目：大模型与群体智能决策报告人：蒲志强（中国科学院自动化研究所）
	报告题目：人形/四足机器人感控一体强化学习技术研究报告人：朱秋国（浙江大学）
	报告题目：可泛化强化学习和具身应用报告人：白辰甲（中国电信人工智能研究院）
	报告题目：基于机器学习的无人机智能控制报告人：潘为（曼彻斯特大学）
	Panel Discussion
14:00-18:00	Workshop 10：智能体跨学科交叉主持人：崔颖（香港科技大学（广州））	E4-102
	报告题目：在AI时代激励每个学生幸福成长报告人：杨旸（香港科技大学（广州））
	报告题目： Beautimeter: 利用GPT技术进行自我镜像测试，评估建筑和城市之美报告人：江斌（香港科技大学（广州））
	报告题目： 6G：从连接泛在到智慧泛在报告人：陈天骄（中国移动研究院）
	报告题目：深度学习及大语言模型在基因组和生物数据分析中的应用报告人：张延林（香港科技大学（广州））
	Panel Discussion
14:00-18:00	Workshop 11：智能运筹优化主持人：张一帆（中国科学院自动化研究所）	演讲厅B
	报告题目：离散优化问题的人工智能方法报告人：严骏驰（上海交通大学）
	报告题目： Atomic Dynamic Flow Games: Adaptive vs. Nonadaptive Agents 报告人：王长军（中国科学院数学与系统科学研究院）
	报告题目：数智驱动的图上组合优化问题学习型求解技术报告人：范长俊（国防科技大学）
	报告题目：工业决策智能：从启发式走向大模型报告人：王杰（中国科学技术大学）
	报告题目： MindOpt优化求解技术与应用进展报告人：王孟昌（阿里达摩院）
	报告题目：如何让大语言模型协助经典智能规划报告人：卓汉逵（中山大学）

时间	10月14日	10月15日	10月16日	10月17日	10月18日
9:30-12:30	机器学习	基础大模型	强化学习	多智能体	具身智能
14:30-17:30	基础大模型	大模型实践	强化学习实践	大模型智能体	具身智能实践
地点	N+荟馆三楼路演厅	N+荟馆三楼路演厅	演讲厅B	演讲厅B	N+荟馆三楼路演厅
授课团队	授课团队由汪军老师领衔，联合伦敦大学学院、上海交通大学、中国科学院自动化研究所、华为诺亚实验室、腾讯开悟平台等高校和企业专家组成

时间

10月14日

10月15日

10月16日

10月17日

10月18日

9:30-12:30

机器学习

基础大模型

强化学习

多智能体

具身智能

14:30-17:30

基础大模型

大模型实践

强化学习实践

大模型智能体

具身智能实践

地点

N+荟馆三楼路演厅

演讲厅B

N+荟馆三楼路演厅

授课团队

授课团队由汪军老师领衔，联合伦敦大学学院、上海交通大学、中国科学院自动化研究所、华为诺亚实验室、腾讯开悟平台等高校和企业专家组成

时间	内容	地点
19:00-22:00	决策智能创业分享会主持人：汪军（伦敦大学学院）	C2-102
报告题目：当科学家成为创业者：创业路上的挑战与机遇报告人：刘元（真格基金）
报告题目：从数据出发，开启AI无限可能报告人：周卉章（上海尖晶投资有限公司）
报告题目：穹彻智能的具身智能实践报告人：王竞凡（上海穹彻智能科技有限公司）
报告题目：以GenAI技术赋能城市建设与运维：我的创业探索报告人：张攀（墨力云智能）
报告题目：对话即商业：Gen AI x Conversation AI的创业机遇与挑战报告人： Linda Jiang（Neurowave）
报告题目： AI music for all mankind 报告人：夏雨（小叶子音乐科技）
报告题目：智能软件维护的未来：利用大模型驱动提升软件质量与效率报告人：李凌波（无限思维科技有限公司）
报告题目：创投如何赋能人工智能报告人：董和瀚（戈壁创投）

时间

内容

地点

19:00-22:00

决策智能创业分享会

主持人：汪军（伦敦大学学院）

C2-102

报告题目：当科学家成为创业者：创业路上的挑战与机遇

报告人：刘元（真格基金）

报告题目：从数据出发，开启AI无限可能

报告人：周卉章（上海尖晶投资有限公司）

报告题目：穹彻智能的具身智能实践

报告人：王竞凡（上海穹彻智能科技有限公司）

报告题目：以GenAI技术赋能城市建设与运维：我的创业探索

报告人：张攀（墨力云智能）

报告题目：对话即商业：Gen AI x Conversation AI的创业机遇与挑战

报告人： Linda Jiang（Neurowave）

报告题目： AI music for all mankind

报告人：夏雨（小叶子音乐科技）

报告题目：智能软件维护的未来：利用大模型驱动提升软件质量与效率

报告人：李凌波（无限思维科技有限公司）

报告题目：创投如何赋能人工智能

报告人：董和瀚（戈壁创投）

时间	内容	地点
19:00-20:00	Workshop 10：智能体跨学科交叉主持人：崔颖（香港科技大学（广州））	演讲厅B
报告题目：转变路径：人类旅行行为演变背后的理论报告人：Frank Witlox （根特大学）

时间

内容

地点

19:00-20:00

Workshop 10：智能体跨学科交叉

主持人：崔颖（香港科技大学（广州））

演讲厅B

报告题目：转变路径：人类旅行行为演变背后的理论

报告人：Frank Witlox （根特大学）

RLChina 2024 SCHEDULE

导航

联系方式