Follow

分享 GitHub 上一个简单高效的强化学习后训练框架:RL-Factory,专门用于智能体学习。

该框架采用环境解耦设计,只需提供工具配置和奖励函数就能开始训练,还支持异步工具调用让训练速度提升 2 倍。

GitHub: github.com/Simple-Efficient/RL

主要功能:

- 环境解耦设计,一键式配置 MCP 工具和自定义工具;

- 异步并行工具调用,训练效率比传统框架提升 2 倍;

- 原生支持 Qwen3 模型,无需 SFT 即可准确调用工具;

- 多种奖励计算方式,支持规则、模型判断和工具调用;

- 批处理和分布式模型判断,大幅提升训练效率;

- 多代理扩展支持,可转换为 MCP 格式进行交互。

旨在让我们每个人都能轻松快速地使用 Qwen3 和 MCP 工具训练出自己的智能代理。

具有一定强化学习基础的开发者感兴趣的可以看一下。

:icon_weibo: weibo.com/5722964389/PtE8xvEkb

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。