ICode9

精准搜索请尝试: 精确搜索
  • kaldi例子thchs30笔记(二)2021-03-11 13:30:07

    数据准备 由于我们已经下载过数据了,直接进行数据准备。 根据注释,我们知道,数据准备就是要产生四个文件分别是text,wav.scp,utt2spk,spk2utt (1)text:音频标注 (2)wav.scp:指定音频路径 (3)utt2spk:音频对应的说话人信息 (4)spk2utt:说话人对应的音频信息 打开s5/local/thchs-30_da

  • kaldi_thchs30_2 run.sh2021-01-11 17:00:34

    run.sh #[ -d $thchs ] || mkdir -p $thchs || exit 1 #echo "downloading THCHS30 at $thchs ..." #local/download_and_untar.sh $thchs http://www.openslr.org/resources/18 data_thchs30 || exit 1 #local/download_and_untar.sh $thchs http://www.opensl

  • AIBigKaldi(十)| Kaldi的thchs30实例(源码解析)2021-01-08 23:02:29

     本文来自公众号“AI大道理”。      单音子模型的假设是一个音素的实际发音与其左右的音素无关。这个假设与实际并不符合。由于单音子模型过于简单,识别结果不能达到最好,因此需要继续优化升级。就此引入多音子的模型。 最为熟悉的就是三音子模型,即上下文相关的声学模型。 在Ye

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有