thchs30

kaldi例子thchs30笔记（二）2021-03-11 13:30:07

数据准备由于我们已经下载过数据了，直接进行数据准备。根据注释，我们知道，数据准备就是要产生四个文件分别是text，wav.scp，utt2spk，spk2utt (1)text:音频标注 (2)wav.scp:指定音频路径 (3)utt2spk:音频对应的说话人信息 (4)spk2utt:说话人对应的音频信息打开s5/local/thchs-30_da
kaldi_thchs30_2 run.sh2021-01-11 17:00:34

run.sh #[ -d $thchs ] || mkdir -p $thchs || exit 1 #echo "downloading THCHS30 at $thchs ..." #local/download_and_untar.sh $thchs http://www.openslr.org/resources/18 data_thchs30 || exit 1 #local/download_and_untar.sh $thchs http://www.opensl
AIBigKaldi（十）| Kaldi的thchs30实例（源码解析）2021-01-08 23:02:29

本文来自公众号“AI大道理”。单音子模型的假设是一个音素的实际发音与其左右的音素无关。这个假设与实际并不符合。由于单音子模型过于简单，识别结果不能达到最好，因此需要继续优化升级。就此引入多音子的模型。最为熟悉的就是三音子模型，即上下文相关的声学模型。在Ye

ICode9