上善若水
人生可以平凡,但不可以平庸~碌碌无为,与朽木浮草何异?
发布于
评论(4)
  • 上善若水
    上善若水 回复
    杜雅丽 (招博后/博士) 杜雅丽 (招博后/博士) 2022-08-24 19:38:55
    可以看动作空间, 比如一个 agent 有 k 个 action, 2 个 agent 对应 joint action space是 k*k=k^2, N个对应 k^N。 所以联合动作空间是指数增长的。
    感谢老师的解答~我将继续好好认真的学习相关知识做好科研任务~期望能有跟您多多交流学习的机会
  • 杜雅丽 (招博后/博士)
    可以看动作空间, 比如一个 agent 有 k 个 action, 2 个 agent 对应 joint action space是 k*k=k^2, N个对应 k^N。 所以联合动作空间是指数增长的。
  • 上善若水
    上善若水 回复
    杜雅丽 (招博后/博士) 杜雅丽 (招博后/博士) 2022-08-24 19:01:20
    这个状态动作空间维度是根据问题来的。 比如如果状态是 2d空间的location, 那么s=[x,y]是 2 维的,x 和 y 可以各自取实数, 也能对应上你说的元素个数。
    十分感谢老师您~~~老师,因为我基础理论有点不扎实,有一些比较基础性的疑问,抱歉打扰您,想再请教一下您;我学到多智能体联合观测空间、联合动作空间,张崇洁老师有讲到维度灾难,是因为它们的空间维度会是单个智能体状态、动作空间维度的n次方,n是智能体个数,因为它们做了笛卡尔积运算,我不太理解联合空间的维度为什么会是笛卡尔积的结果这样n次方的结果,我理解还是您假设那样的,state是2d空间的location的话,那state就两个变量x和y(即坐标),如果有n个智能体,它们的观测都只是2d空间的location的话,我理解(虽然我知道是错误的)联合观测空间维度是2n(2n个变量),但实际上其空间维度应该是2^n?十分感谢老师,因为也是系里第一个研究强化学习的研究生,实验室里也没有人之前搞过,所以一切都是我自己摸索着学习,十分感谢老师的讲解!也特别感谢RLChina给我们提供了这么好的交流和学习的机会!言语无法表达了,只能是心里由衷万分的感谢!谢谢老师的指点!感谢感谢~~~
  • 杜雅丽 (招博后/博士)
    这个状态动作空间维度是根据问题来的。 比如如果状态是 2d空间的location, 那么s=[x,y]是 2 维的,x 和 y 可以各自取实数, 也能对应上你说的元素个数。