基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的

发布时间：2021-12-10 19:13:01 来源：亿速云阅读：196 作者：柒染栏目：大数据

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

之前训练 AutoVC 用过

处理数据的逻辑从: /ceph/home/hujk17/Tuned-GE2E-SayEN-EarSpeech/FaPig_extract_GE2E_VCTK_nosli.py 开始
保留了 train, val, unseen. 训练的时候只使用 train

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的

在 2.1. 中也一并提取了, 使用 GE2E

在 2.1. 中也一并提取了, 使用实验室的 mel. 嘿嘿(●ˇ∀ˇ●), 终于方便啦

256 的 Embedding 仍然后面接了一个 FC, 和中文的一致
中文的叫 FaPig, 英文叫 Kiss, 逻辑从 Kiss_train.py 开始
from synthesizer.FaPig_train import train 和 from synthesizer.Kiss_train import train 其实完全一致, 只是为了统一格式, 拷贝了一份

看完上述内容，你们掌握基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注亿速云行业资讯频道，感谢各位的阅读！

向AI问一下细节

猜你喜欢