Follow

来自清华团队开源的一个 AI 项目:PRIME。

通过强化学习技术,仅用 8 张显卡,短时间内就训练出一个 7B 模型,而且在数学推理能力上超越 GPT-4o 以及 Llama-3.1 70B。

GitHub: github.com/PRIME-RL/PRIME

还提出一个算法,能够在不依赖高质量数据的情况下,显著提升训练模型的推理能力。

在 X(Twitter)上,引起不少开发者转发分享讨论,甚至得到 ChatGPT 此前联合创始人 John Schulman 的点赞。

有模型训练需求的同学,值得关注下。

:icon_weibo: weibo.com/5722964389/P8A3pCyeU

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。