- 发布于2023-06-15 15:12:15
混合动作空间|揭秘创造人工智能的黑魔法(4)
还记得我们的混合动作空间专栏吗?过去的三篇专栏里,我们介绍了混合动作空间的定义,常见的动作空间预处理方法,并将当前学术界解决混合动作空间的方法总结为以下三类: 基于状态-动作值函数 Q 的方法 基于状态值函数 V 的方法 基于动作空间学习和转换的方法 ...赞 1评论浏览 140 - 赞评论浏览 256
- 发布于2022-06-08 12:13:41
玩转Python|类与方法的隐藏秘密(3)
上期为大家准备的 Python 攻略,从原理上讲了 Python 类的本质,接下来的两篇 Python 专栏里,继续来讲讲关于类及其方法的一些冷知识和烫知识。 我们也会和前面两篇专栏一样,用各种神奇的例子,从原理和机制的角度为你还原一个不一样的 Pytho...赞 2评论浏览 512 - 发布于2022-05-31 15:08:52
混合动作空间|揭秘创造人工智能的黑魔法(3)
在前两篇博客中,我们介绍了深度强化学习的动作空间定义和常见的预处理方法。 混合动作空间 | 揭秘创造人工智能的黑魔法(1) 混合动作空间 | 揭秘创造人工智能的黑魔法(2) 过去的强化学习研究大部分都关注离散动作和连续动作问题,但由于混合动作空间在诸多真实...赞 1评论浏览 1035 - 发布于2022-03-25 11:17:17赞评论浏览 504
- 赞评论浏览 464
- 发布于2021-11-28 10:47:55赞 3评论 3浏览 1615
- 发布于2021-10-15 09:32:11
强化经典面试题(一)
已经入坑一段时间,想整理一个强化学习面试题专栏。这里面有参考网上的问题和答案,也有自己平时遇到的。欢迎来一起讨论 🥰 Let's start, shall we? 1. 什么是强化学习? 强化学习由环境、动作和奖励组成,强化学习的目标是使得作出的一系列决...赞 2评论 2浏览 1209