https://github.com/LAION-AI/Open-Assistant
最值得关注的几点:
- 如何工作的?通过收集高质量的人工生成的 Instruction-Fulfillment 样本(提示 + 响应),目标 >50k。我们设计了一个众包流程来收集和审查提示。我们不想训练泛滥/有毒/垃圾邮件/垃圾/个人信息数据。
- 如何进行训练的?根据提示和奖励模型进行 RLHF 的训练 { ChatGPT的RLHF就是基于人类反馈(Human Feedback)对语言模型进行强化学习(Reinforcement Learning)}。
- 有什么样的愿景?我们不会止步于复制 ChatGPT。我们希望构建未来的助手,不仅能够编写电子邮件和求职信,还能做有意义的工作、使用 API、动态研究信息等等,并且能够由任何人进行个性化和扩展。我们希望以一种开放和可访问的方式来做到这一点,这意味着我们不仅要构建一个出色的助手,还要使其足够小且高效以在消费类硬件上运行。
- 这是 LAION 的 repo,LAION 是一个解放机器学习研究、模型和数据集的非营利组织。
未来人手一个mini ChatGPT,未来已来。