Amphion:一个开源的音频、音乐和语音生成整合工具包。
支持如下功能:
- 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。
- 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。
- 文本转音频(TTA):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM。
GitHub: https://github.com/open-mmlab/Amphion
以上功能均可在 HuggingFace 上使用。