yaodong 北京大学助理教授

发布于 2021-10-12 00:36:08

多智能体置信域策略优化算法 (Trust Region Methods in Multi-Agent Reinforcement Learning)

浏览 (3308) 点赞 (13) 收藏

评论(2)

AINova 2021-10-12 16:30:37 回复

Mark
张海峰 2021-10-12 16:07:42 回复

赞，欢迎耀东老师多多分享！

北京大学助理教授

关注了
0
关注者
24
积分
9
注册排名
172