**GitHubDaily** @[email protected] · 2025-01-08T00:00:16Z

GitHubDaily @[email protected]

来自清华团队开源的一个 AI 项目：PRIME。

通过强化学习技术，仅用 8 张显卡，短时间内就训练出一个 7B 模型，而且在数学推理能力上超越 GPT-4o 以及 Llama-3.1 70B。

还提出一个算法，能够在不依赖高质量数据的情况下，显著提升训练模型的推理能力。

在 X（Twitter）上，引起不少开发者转发分享讨论，甚至得到 ChatGPT 此前联合创始人 John Schulman 的点赞。

有模型训练需求的同学，值得关注下。 #AI创造营