一款能媲美 Suno 的开源音乐模型:ACE-Step,能在极短时间内生成高质量音乐,比传统 AI 模型快 15 倍!
通过结合扩散生成模型和轻量级 Transformer,同时在训练中利用 REPA 技术实现语义对齐,实现生成的音乐既保持高度连贯性,又能精确对齐歌词。
GitHub: https://github.com/ace-step/ACE-Step
主要功能:
- 一键生成完整音乐作品,支持 19 种语言和各种音乐风格;
- 声音克隆、歌词编辑、混音等高级控制机制,灵活调整音乐细节;
- 专用 LoRA 模型可从歌词直接生成人声样本,加速作曲流程;
- 局部重绘功能可选择性修改特定部分,无需重新生成整首歌曲;
- 提供歌词到人声、文本到采样、即将推出的说唱机器和声轨生成等功能;
- 高效性能设计,在 A100 GPU上仅需 20 秒即可合成 4 分钟的音乐;
模型下载:huggingface.co/ACE-Step/ACE-Step-v1-3.5B
在线体验:huggingface.co/spaces/ACE-Step/ACE-Step
目前项目代码和模型均已开源,并且提供了 ComfyUI 节点,方便大家快速使用。