评论(4)
请
登录后发表观点
-
这里讲的 nextstate 有两个相关概念,一个是用户给出的询问 a_u,一个是 a_u 经过处理后给网络使用的 nextstate。世界模型产生的 a_u 是一个多维向量,每一维表示一个语法位,之后 a_u 通过 argmax 取预设词库中对应语法位的值产生一个自然语言的句子(对应用户给出的真实经验),经过 NLU 编码生成给网络输入的 nextstate,也是向量。
感谢学长回复!请问在预测这个多维的 nextstate 时,GP 模型可以做这种多维的预测吗?还是说对每个维度构建一个 GP 模型?
-
请问第三位栾学长,GP 模型输出的 nextstate 是一个值还是一个向量