RLChina 2025 会议日程安排
大会第1天(9 月 20 日)
时间 | 内容 |
---|---|
09:00-12:30 | 论坛 1:未来RL论坛
主持人: 赵鉴(北京中关村学院)
|
报告题目: 从PPO到DPO:一个统一策略优化框架及其在大型语言模型训练中的应用
报告人:汪跃 (北京中关村学院)
|
|
报告题目: 蛋白-配体相互作用引导的多目标强化学习药物设计
报告人: 闵垚森 (北京中关村学院)
|
|
报告题目: 基于大语言模型的智能体白盒决策与主动进化
报告人: 邓悦(北京中关村学院)
|
|
报告题目: 迈向真实世界多目标强化学习
报告人: 张霄远(北京中关村学院)
|
|
报告题目: Modeling Earth-Scale Human-Like Societies with One Billion Agents
报告人: 何纪言(北京中关村学院)
|
|
09:00-12:30 | 论坛 2:AI软硬件系统论坛
主持人: 朱振华(清华大学)
|
报告题目: 大语言模型辅助的处理器芯片设计
报告人: 王颖(中国科学院计算技术研究所)
|
|
报告题目:面向生成式模型的软硬协同芯片架构设计
报告人:贾天宇(北京大学)
|
|
报告题目: 基于量化稀疏的高效训练推理:理论及算法
报告人:陈键飞(清华大学)
|
|
报告题目: RLinf: A System for Adaptive, Dynamic, Fine-Grained Scheduling in Reinforcement Learning
报告人: 于超(清华大学)
|
|
报告题目: 低比特大语言模型:从模型到系统到硬件
报告人: 曹士杰(微软亚洲研究院)
|
|
报告题目: Ark: An Open-source Python Framework for Robot Learning
报告人: Christopher E. Mower(华为诺亚方舟实验室)
|
|
09:00-12:30 | 论坛 3:数据智能论坛
主持人:张文涛(北京大学)
|
报告题目: Meta-rater:预训练语言模型的多维数据筛选方法
报告人:何聪辉 (上海人工智能实验室)
|
|
报告题目:从智能问数到数据智能体:范式演进与反思
报告人:骆昱宇(香港科技大学(广州))
|
|
报告题目: 多模态数据智能查询与分析系统
报告人:柴成亮(北京理工大学)
|
|
报告题目:Data×LLM:云智数据基座与数据密集型分析应用
报告人:周煊赫 (上海交通大学)
|
|
报告题目:数据视角下的模型压缩加速
报告人:张林峰 (上海交通大学)
|
|
12:30-14:00 | 午休
|
14:00-18:00 | 论坛 4:强化学习理论论坛
主持人: 李帅(上海交通大学)
|
报告题目: BanditSpec: Adaptive Speculative Decoding via Bandit Algorithms
报告人: 陈延福(新加坡国立大学)
|
|
报告题目: On Games with Conflicting Interests
报告人:王趵翔(香港中文大学(深圳))
|
|
报告题目: Fusing Reward and Dueling Feedback in Stochastic Bandits
报告人:左金航(香港城市大学)
|
|
报告题目:Bandit Learning in Matching Markets with Indifference
报告人:孔芳(南方科技大学)
|
|
报告题目:Transformer两阶段学习范式
报告人:滕佳烨(上海财经大学)
|
|
14:00-18:00 | 论坛 5:推理大模型论坛
主持人:袁洋 (清华大学)
|
报告题目: 基于智能体的强化学习数据构建与奖励设计
报告人: 张辉帅(北京大学)
|
|
报告题目: 基于拓扑斯理论的大规模软件辅助生成框架
报告人: 袁洋(清华大学)
|
|
报告题目: 百度研发智能化探索与实践
报告人:彭云鹏 (百度文心快码)
|
|
报告题目: 基于强化学习的大模型推理能力提升
报告人:李佳 (清华大学)
|
|
报告题目: The Language of Action: Deliberate Minds in Games
报告人:冯熙栋 (Google DeepMind)
|
|
14:00-18:00 | 论坛 6:科学智能体论坛
主持人:严骏驰 (上海交通大学)
|
报告题目: 数据智能和理实迭代的科研范式探索
报告人: 朱濯缨(中国科学技术大学)
|
|
报告题目: InternAgent:构建面向通用科研场景的闭环智能体系统
报告人:张铂(上海人工智能实验室)
|
|
报告题目: LLM驱动的量子科学智能体
报告人:张鹏(天津大学)
|
|
报告题目: 可持续进化的多智能体系统
报告人: 程然(香港理工大学)
|
|
报告题目: 大模型自主智能体与工具学习
报告人: 陈颢天(清华大学)
|
|
报告题目: 大语言模型的深度思考能力探索
报告人: 张启超(中国科学院自动化研究所)
|
|
14:00-18:00 | 论坛 7:多智能体论坛
主持人:朱圆恒(中国科学院自动化研究所)
|
报告题目: 形式逻辑和大模型融合驱动的集群任务规划方法
报告人: 李忠奎(北京大学)
|
|
报告题目:集群系统协同控制理论及在飞行器集群中的应用
报告人: 董希旺 (北京航空航天大学)
|
|
报告题目:世界模型与机械臂操作
报告人: 王钢(北京理工大学)
|
|
报告题目: AReaL: a Large-Scale RL System for LLM Agents
报告人:吴翼(清华大学)
|
|
报告题目: 基于强化学习的大模型智能体能力扩展方法
报告人:温颖(上海交通大学)
|
|
报告题目: 智能体赋能车路云一体化
报告人:郭振华 (天翼交通科技有限公司)
|
|
14:00-18:00 | 论坛 8:计算经济学论坛
主持人:王子贺(中国人民大学)
|
报告题目: Proper Dataset Valuation by Pointwise Mutual Information
报告人: 郑舒冉(清华大学)
|
|
报告题目:Privacy-constraint Signals
报告人: 赵玮(清华大学)
|
|
报告题目:Algorithmic Robust Forecast Aggregation
报告人: 孔雨晴(北京大学)
|
|
报告题目: A New Paradigm for Generative Auto-Bidding
报告人:蔡庆芃(快手科技)
|
|
报告题目: AI-Driven Mechanism Design for Online Advertising
报告人:祁琦(中国人民大学)
|