**GitHubDaily** @[email protected] · 2024-01-04T09:30:16Z

GitHubDaily @[email protected]

OpenVoice：多功能即时声音克隆技术。

这是由 MyShell 团队开发的一项技术，只需提供一段简短的音频样本，就能克隆出原发言者的声音，并能以此生成各种语言的语音。

它具有如下优势：

1）高精度音色克隆

能够高度还原参考音色，支持多语种和多种口音的语音生成。

2）灵活的声音风格调控

可以对声音的情感、口音进行精细调整，还可以控制节奏、停顿和语调等多种声音风格。

3）无需样本的跨语言声音克隆

无论是参考声音还是生成的声音，都可以是大型多语种数据集之外的任何语言。

测试了下，中文效果不是很好，对此 MyShell 团队也清楚并表示正在优化处理。