RLChina 强化学习社区

RLChina 强化学习社区

  • 发动态
  • 发帖子
登录/注册
首页
话题
  • 发动态
  • 发帖子
消息
登录/注册
最新
推荐
自动化所杨企鹏
自动化所杨企鹏 这家伙很懒,什么都没留下
发布于 2024-08-30 16:46:02

一文七问|自博弈微调(Self-Play Fine-Tuning)将弱语言模型转换为强语言模型

论文研讨
自动化所杨企鹏
浏览 (1154) 点赞 (1) 收藏
评论
请 登录后发表观点
    自动化所杨企鹏
    自动化所杨企鹏
    这家伙很懒,什么都没留下
    • 关注了
      0
    • 关注者
      0
    • 积分
      5
    • 注册排名
      2327
    关于 标签 友链