- 发布于2023-11-07 16:05:37
RL和域泛化相结合
如题,域泛化和强化学习最容易想到的就是在 A 域上先训练出一个模型,然后设定强化学习 agent 通过对 B 域不断探索,找到一个最优策略,这应该是最简单的想法,但在 22 年的域泛化综述上只提到了机器人的 control 问题,而在 23 年论文里也没有...赞评论浏览 527 - 发布于2023-06-15 15:12:15
混合动作空间|揭秘创造人工智能的黑魔法(4)
还记得我们的混合动作空间专栏吗?过去的三篇专栏里,我们介绍了混合动作空间的定义,常见的动作空间预处理方法,并将当前学术界解决混合动作空间的方法总结为以下三类: 基于状态-动作值函数 Q 的方法 基于状态值函数 V 的方法 基于动作空间学习和转换的方法 ...赞 1评论浏览 510 - 发布于2023-03-09 18:07:44
良师益友|天津大学郝建业:人工智能的前途在于应用
导读 “良师益友”是 RLChina 的一个栏目,以采访的形式记录学者对科研工作的思考。 本篇文章主要介绍对天津大学副教授、华为诺亚方舟决策推理实验室主任郝建业博士的采访,主要涉及个人经历、学术观点、产业观点、其他观点 4 个部分,共计 10 个问题。快来...赞 2评论浏览 1342 - 赞评论浏览 696
- 发布于2022-06-08 12:13:41
玩转Python|类与方法的隐藏秘密(3)
上期为大家准备的 Python 攻略,从原理上讲了 Python 类的本质,接下来的两篇 Python 专栏里,继续来讲讲关于类及其方法的一些冷知识和烫知识。 我们也会和前面两篇专栏一样,用各种神奇的例子,从原理和机制的角度为你还原一个不一样的 Pytho...赞 2评论浏览 942 - 发布于2022-05-31 15:08:52
混合动作空间|揭秘创造人工智能的黑魔法(3)
在前两篇博客中,我们介绍了深度强化学习的动作空间定义和常见的预处理方法。 混合动作空间 | 揭秘创造人工智能的黑魔法(1) 混合动作空间 | 揭秘创造人工智能的黑魔法(2) 过去的强化学习研究大部分都关注离散动作和连续动作问题,但由于混合动作空间在诸多真实...赞 1评论浏览 1777 - 发布于2022-05-27 12:51:30
混合动作空间|揭秘创造人工智能的黑魔法(2)
引言: 我们之前的一篇文章(混合动作空间 | 揭秘创造人工智能的黑魔法(1))中,详细地介绍了强化学习目前常见的动作空间类型,如离散动作、连续动作、混合动作等。本文则将以游戏环境为例,介绍如何对强化学习的动作空间进行预处理(action space sha...赞 1评论浏览 1035 - 发布于2022-03-25 11:17:17赞评论浏览 847
- 赞评论浏览 848
- 发布于2021-11-28 10:47:55赞 3评论 3浏览 2343