对带噪语音做噪声抑制,在远场语音识别和通话中都会用到,也都会碰到一个矛盾,是尽量的消除噪声即便对语音有损伤,还是尽量的不损伤语音即便保留一些噪声呢?
笔者这些年,接触了不少语音识别行业和通话行业的人,大家都在说,我们是两个行业,虽然噪声抑制的原理差不多,但是一个是给机器听的,一个是个人听的。
那么具体有什么不同呢?
语音识别行业的说,我们不需要降那么干净,不能损伤语音,否则会影响识别的效果。你们通话行业,可以降得狠一些,反正人的纠错能力很强,对语音损伤一点关系不大。
而通话行业的说,我们是给人听的,舒适度最重要,宁可噪声多留一点,也不能损伤语音。你们识别行业,可以降得狠一些,反正给机器听,能识别出来就行。
哈哈,两个行业对对方的认知竟然有这么大差异,不知不觉中竟然走到了一条路线上来,最终结果呢?都是希望不损伤语音。
其实语音识别行业和通话行业,对降噪的最大差别是:是不是要求按帧实时处理。
语音识别行业根据使用场景,是可以积累一定的数据量再处理的,而通话行业,则必须是按帧实时处理。
加上这个限定,通话行业对噪声抑制的算法要求更苛刻一些,在语音识别行业可以用的方法,改成按帧实时后,效果往往会打折扣。
标签:损伤,远场,噪声,通话,语音,识别,行业 来源: https://www.cnblogs.com/c6000/p/10701891.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。