RTVC 中 ASV 和 TTS 模块结合使用的调研示例分析

发布时间：2022-01-14 22:30:12 阅读：157 作者：柒染栏目：大数据

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

本篇文章为大家展示了RTVC 中 ASV 和 TTS 模块结合使用的调研示例分析，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

不知道如何克服 ASV 的输出 SV Vector 应用到 TTS 后, 合成时候的 Unseen Speaker 问题

背景描述:

不管是 M2VoC 还是音色迁移版本 Cross-lingual TTS, 均可以

因此调研下文献以及讨论

不用更改思路, 增多 VCTK 类似的思路, 仔细训练

主要贡献可以体现在

不用本身提取的 SVV, 寻找他最近的那个

使用 ASV 得到 SVV, 然后不直接使用 SVV, 而是通过 Attention 将 SVV 表示成几个 GST 的加权和, 然后参与 TTS

训练的时候允许 ASV 进行梯度回传的修改

上述内容就是RTVC 中 ASV 和 TTS 模块结合使用的调研示例分析，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注亿速云行业资讯频道。

向AI问一下细节

猜你喜欢