ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

MFCC语音处理的简要流程

2019-07-04 11:54:56  阅读:299  来源: 互联网

标签:简要 语音 MFCC Mel 信号 分帧 梅尔


最近在培训师弟时发现,有些师弟对于MFCC的特征提取流程还不熟悉,故写这篇博客。

      梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC),顾名思义,该方法的特征提取简单讲包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析。

整体过程主要包含以下步骤:

1)预加重,作用就是为了消除发声过程中,声带和嘴唇造成的效应,来补偿语音信号受到发音系统所压抑的高频部分。并且能突显

高频的共振峰。

2)分帧,将语音信号分为帧

3)加窗,分帧后,每一帧的起始段和末尾端会出现不连续的地方,所以分帧越多与原始信号的误差也就越大。加窗就是为了解决这个问题,使分帧后的信号变得连续,每一帧就会表现出周期函数的特征。在语音信号处理中一般加汉明窗对每帧信号加一个hamming/hanning窗,使每帧信号两端衰减至接近0

4)DFT(Discrete Fourier Transform),得到向量特征,并将能量(幅值)谱转化为功率谱

5)Mel滤波,通过Mel滤波器组进行滤波,以得到mel频谱(符合人耳听觉习惯的声谱)

6)倒谱分析:首先取对数,然后做逆变换。在实现过程中逆变换一般是通过Discrete cosine Transform(DCT)来实现,取DCT后的系数即为梅尔频率倒谱系数MFCC,也就是这帧语音的特征。

参考的博客:http://www.voidcn.com/article/p-aifqjucc-bqe.html

 

 

标签:简要,语音,MFCC,Mel,信号,分帧,梅尔
来源: https://blog.csdn.net/m0_37920951/article/details/94601247

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有