OpenVoice是一种多功能的语音克隆方法,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。
开放访问权重
- 除了复制参考说话者的音色之外,它还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。
- 他们建议使用基本 TTS (VITS) 模型来控制合成音频的风格和语言,并使用音色转换器来体现韵律。
- 基础 TTS 模型 (VITS) 在 30K 音频样本上进行训练。
- 音色转换器使用 300K 音频样本进行训练。
- 音频样本分散在中文、日语和英语中。
在线体验链接:https://huggingface.co/spaces/myshell-ai/OpenVoice
AI工具专区:https://heehel.com/category/ai-soft
更多作品:https://heehel.com/category/ai-works
https://heehel.com/aigc/meta-new-graphical-model.html
https://heehel.com/aigc/pixverse.html