Follow

在过去的短短几个月,以 ChatGPT、GPT4 为代表的 AI 应用和大模型火爆全球,被视为开启了新的科技工业革命和 AGI (通用人工智能)的新起点。

不仅科技巨头间你追我赶,争相推出新品,许多学术界、工业界的 AI 大佬也纷纷投入投身相关创业浪潮。

作为当下最受欢迎的开源 AI 大模型解决方案,GitHub 上一个开源项目 Colossal-AI 也建立了一整套完整的 RLHF 流程,包括:监督数据集收集 -> 监督微调 -> 奖励模型训练 -> 强化学习微调。

并且,技术团队以 LLaMA 为基础预训练模型,正式推出了 ColossalChat,这也是目前最接近 ChatGPT 原始技术方案的实用开源项目。

GitHub: github.com/hpcaitech/ColossalA

该项目包括但不限于以下功能:

- Demo:可直接在线体验模型效果,无需注册或 waitinglist;

- 训练代码:开源完整 RLHF 训练代码,已开源至含 7B 和 13B 两种模型;

- 数据集:开源 104K 中、英双语数据集;

- 推理部署:4bit 量化推理 70 亿参数模型仅需 4GB 显存;

- 模型权重:仅需单台服务器少量算力即可快速复现;

- 更大规模模型、数据集、其他优化等将保持高速迭代添加。

目前,相关代码已开源至 GitHub,感兴趣的同学可以看下。

项目还有提供完整的中文教程,进一步降低学习门槛,让大家能更快上手开发。

:icon_weibo: weibo.com/5722964389/MztZQ7PvO

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。