这家伙很懒,什么都没留下
发布于

RLChina 论文研讨会第11期(2022.02.22直播)

评论(4)
  • luanshaotong
    luanshaotong 回复
    A allenwa 2022-05-11 19:48:14

    感谢学长回复!请问在预测这个多维的 nextstate 时,GP 模型可以做这种多维的预测吗?还是说对每个维度构建一个 GP 模型?

    我们是每个维度搞了一个 GP,实现简单好调,输出的相关性在这个问题里影响也不是很大。经典的 GP 不能做有相关性的多输出预测,但是有很多现代方法可以实现,具体可以看一下各个库的文档和论文

  • allenwa 回复
    luanshaotong luanshaotong 2022-05-11 19:38:50

    这里讲的 nextstate 有两个相关概念,一个是用户给出的询问 a_u,一个是 a_u 经过处理后给网络使用的 nextstate。世界模型产生的 a_u 是一个多维向量,每一维表示一个语法位,之后 a_u 通过 argmax 取预设词库中对应语法位的值产生一个自然语言的句子(对应用户给出的真实经验),经过 NLU 编码生成给网络输入的 nextstate,也是向量。

    感谢学长回复!请问在预测这个多维的 nextstate 时,GP 模型可以做这种多维的预测吗?还是说对每个维度构建一个 GP 模型?

  • luanshaotong
    luanshaotong 回复
    A allenwa 2022-05-10 09:50:48

    请问第三位栾学长,GP 模型输出的 nextstate 是一个值还是一个向量

    这里讲的 nextstate 有两个相关概念,一个是用户给出的询问 a_u,一个是 a_u 经过处理后给网络使用的 nextstate。世界模型产生的 a_u 是一个多维向量,每一维表示一个语法位,之后 a_u 通过 argmax 取预设词库中对应语法位的值产生一个自然语言的句子(对应用户给出的真实经验),经过 NLU 编码生成给网络输入的 nextstate,也是向量。

  • allenwa 回复

    请问第三位栾学长,GP 模型输出的 nextstate 是一个值还是一个向量