标签:大白话 TTS 实现 scipy 数组 wav -- id
实现TTS先了解数据wav文件
不知道童鞋们知不知道scipy这个函数(看,有童鞋举爪了),这个函数实现了读取wav文件的过程,具体是:scipy.io.wavefile这个函数,这个函数读取wav文件之后表现为数组的形式,这样就明了多了,wav文件通过scipy转码成为了数组的形式,同样数组也可以通过scipy.io.wavefile实现存为wav文件。好了,有了对数据的基础认识,接下来聊聊TTS
TTS实现
目前主流的方法大家应该也都了解过是将文字转化为拼音再转化为id,然后通过训练获得模型。浅了浅了,实际上是,文字先转化为拼音,拼音再转化为音素,音素再对应id,id再进行独热编码获得基础特征,后再通过其他的嵌入手段将独热编码稀疏性的缺点抹除,然后再通过构建的模型进行训练,那你可能会说,指导数据呢?前面不是提到了scipy的wav文件读取为数组的方法嘛,你看这不就出来了,文字-->id-->embeding-->model-->通过读取wav的数组指导训练结果
其实往细了讲在进行训练之前还包括数据对齐和数据预处理以及数据归一化,训练之后还包括滤波和声码器合成等操作,确实是一个较难的项目。
标签:大白话,TTS,实现,scipy,数组,wav,--,id 来源: https://blog.csdn.net/qq_34171593/article/details/123119808
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。