|
摘要: 从语音中提取特征是语音信号处理中最关键的过程。梅尔频率倒谱系数(MFCC)是大多数说话者和语音识别应用中最广泛使用的特征,因为该特征中的滤波与人耳中发生的滤波类似。但该特征的主要缺点是仅提供信号的频率信息,而不提供关于何时出现哪个频率的信息。小波变换具有灵活的时频窗口,提供了信号的时频信息,是分析非平稳信号如语音的合适工具。另一方面,由于其均匀的频率缩放,典型的小波变换可能在分析语音信号时效果较差,在低频段的频率分辨率较低,并且与人类听觉感知不太一致。因此,有必要开发一种融合MFCC和小波变换优点的特征。许多研究正在尝试结合这两种特征。目前基于小波变换的梅尔尺度特征提取方法在应用Mel尺度滤波之上进行小波变换时需要更多计算,因为它增加了额外的处理步骤。在这里,我们提出一种结合小波变换概念的时间域内提取梅尔尺度特征的方法,从而减少时频转换的计算负担和小波提取的复杂性。将我们提出的时间域梅尔频率小波系数(TMFWC)技术与贮存计算方法相结合,显著提高了音频信号处理的效率。 更新时间: 2025-10-30 15:42:34 领域: cs.SD,cs.AI,eess.AS
|