米祈睿
中科院自动化研究所2021级直博生~
评论(4)
请
登录后发表观点
-
您读到这篇论文,看了您这篇论文笔记,有一处不理解,原文同样没理解,为什么人类反馈信号会被构建为 e 为底的似然函数?谢谢
-
hello,米博。请问你有“第一届安全强化学习研讨会-Safe RL Workshop”的参会链接吗?或者这个会议
会录播吗?Please click the link below to join the webinar:
https://tum-conf.zoom.us/j/64710447088
Passcode: 930141 -
Please click the link below to join the webinar:
https://tum-conf.zoom.us/j/64710447088
Passcode: 930141 -
hello,米博。请问你有“第一届安全强化学习研讨会-Safe RL Workshop”的参会链接吗?或者这个会议
会录播吗?