米祈睿
中科院自动化研究所2021级直博生~
发布于

论文笔记 | In situ bidirectional human-robot value alignment 实时双向人机价值对齐

评论(4)
  • HWS
    HWS 回复

    您读到这篇论文,看了您这篇论文笔记,有一处不理解,原文同样没理解,为什么人类反馈信号会被构建为 e 为底的似然函数?谢谢

  • 米祈睿
    米祈睿 回复
    草帽 草帽 2022-09-21 16:24:11

    hello,米博。请问你有“第一届安全强化学习研讨会-Safe RL Workshop”的参会链接吗?或者这个会议
    会录播吗?

    Please click the link below to join the webinar:
    https://tum-conf.zoom.us/j/64710447088
    Passcode: 930141

  • 米祈睿
    米祈睿 回复

    Please click the link below to join the webinar:
    https://tum-conf.zoom.us/j/64710447088
    Passcode: 930141

  • 草帽
    草帽 回复

    hello,米博。请问你有“第一届安全强化学习研讨会-Safe RL Workshop”的参会链接吗?或者这个会议
    会录播吗?