开源ChatGPT:OpenAssistant 是一个基于聊天的助手,可以理解任务,可以与第三方系统交互,并为此动态检索信息

torchx1年前 ⋅ 4354 阅读

https://github.com/LAION-AI/Open-Assistant

最值得关注的几点:

  1. 如何工作的?通过收集高质量的人工生成的 Instruction-Fulfillment 样本(提示 + 响应),目标 >50k。我们设计了一个众包流程来收集和审查提示。我们不想训练泛滥/有毒/垃圾邮件/垃圾/个人信息数据。
  2. 如何进行训练的?根据提示和奖励模型进行 RLHF 的训练 { ChatGPT的RLHF就是基于人类反馈(Human Feedback)对语言模型进行强化学习(Reinforcement Learning)}。
  3. 有什么样的愿景?我们不会止步于复制 ChatGPT。我们希望构建未来的助手,不仅能够编写电子邮件和求职信,还能做有意义的工作、使用 API、动态研究信息等等,并且能够由任何人进行个性化和扩展。我们希望以一种开放和可访问的方式来做到这一点,这意味着我们不仅要构建一个出色的助手,还要使其足够小且高效以在消费类硬件上运行。
  4. 这是 LAION 的 repo,LAION 是一个解放机器学习研究、模型和数据集的非营利组织。

未来人手一个mini ChatGPT,未来已来。

InstructGPT 是什么?

@mybooks  InstructGPT 模型比 GPT-3 更擅长遵循指令。他们也不太经常编造事实,并且在有毒输出产生方面表现出小幅下降。InstructGPT 只有13亿神经网络参数,GPT-3有1750亿参数,InstructGPT 实际表现比较稳定,其实就是与人的真实对话回答匹配,GPT-3容易不受控制甚至编造事实。

https://openai.com/blog/instruction-following/#guide

全部评论: 0

    相关推荐