首页 > 其他分享> 文章详细

语音合成论文优:开源数据Hi-Fi Multi-Speaker English TTS Dataset

2021-04-07 21:00:41 阅读：177 来源： 互联网

标签：本文 Multi TTS 论文 Dataset 开源 Fi 数据

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。

欢迎关注微信公众号：低调奋进

Hi-Fi Multi-Speaker English TTS Dataset

本文是NVIDIA在2021.04.03更新的文章，主要为促进tts的multi-speaker的研究，对LibriVox进行处理，获取11speakers的300小时的训练语料，具体文章链接

https://arxiv.org/pdf/2104.01497.pdf

（数据还没放出来，先做个笔记吧）

内容摘要：

本文提到现有的开源TTS数据中高质量的数据很少，因此本文设计了一个新的数据集HI-Fi TTS。table 1展示了目前开源的数据集情况。为了获取高质量的音频和文本，本文制定以下的准则，较高的信噪比，而且text的必须完全正确。另外图1展示了音频质量好坏的图谱。经过一番努力获取了HI-FI tts,具体的数据情况如table2所示，其数据时长分布为图3所示。

标签：本文,Multi,TTS,论文,Dataset,开源,Fi,数据
来源： https://blog.csdn.net/liyongqiang2420/article/details/115495314

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

语音合成论文优:开源数据Hi-Fi Multi-Speaker English TTS Dataset