推荐 GitHub 上一个简单易用的大模型微调数据集创建工具:Easy DataSet。
提供了直观的界面,上传文件,智能分割内容,生成问题,并为模型微调生成高质量的训练数据。
GitHub: https://github.com/ConardLi/easy-dataset
此外,还支持导出 Alpaca、JSON 等多种格式数据集,同时兼容所有遵循 OpenAI 格式的 LLM API。
提供 Windows、MacOS 和 Linux 安装包下载,开箱即用,也支持 Docker 部署和 NPM 安装。