OpenVoice,一种多功能的即时语音克隆方法

OpenVoice是一种多功能的语音克隆方法,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。

OpenVoice,一种多功能的即时语音克隆方法

开放访问权重

  1. 除了复制参考说话者的音色之外,它还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。
  2. 他们建议使用基本 TTS (VITS) 模型来控制合成音频的风格和语言,并使用音色转换器来体现韵律。
  3. 基础 TTS 模型 (VITS) 在 30K 音频样本上进行训练。
  4. 音色转换器使用 300K 音频样本进行训练。
  5. 音频样本分散在中文、日语和英语中。

在线体验链接:https://huggingface.co/spaces/myshell-ai/OpenVoice
AI工具专区:https://heehel.com/category/ai-soft
更多作品:https://heehel.com/category/ai-works

https://heehel.com/aigc/meta-new-graphical-model.html

https://heehel.com/aigc/pixverse.html

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索