1. 基频(Fundamental frequency):指语音信号中最低频率的周期性成分,也称为音调、音高。通常表示为f0。

  2. 频谱包络(Spectral envelope):指语音信号的频率成分在不同频率上的能量分布情况,用于描述声音的音色特征。

  3. 声强度(Intensity):指语音信号中声音的强度大小,通常用dB表示。

  4. 声谱图(Spectrogram):指语音信号在时间和频率上的变化关系,用于展示语音信号的频率特征和时域特征。

  5. 频率轨迹(Frequency trajectory):指语音信号中某个声音元素(如元音)的基频随时间的变化情况,用于描述声音的音调变化。

  6. 语音功率谱(Speech power spectrum):指语音信号的功率谱密度分布,用于描述语音信号的频率成分的能量分布情况。

  7. 频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs):指语音信号在Mel频率上的倒谱系数,用于提取语音信号的特征向量,通常用于语音识别任务。

  8. 短时能量(Short-time energy):指语音信号在一定时间窗口内的平均能量大小,用于描述语音信号的强度大小。

  9. 短时过零率(Short-time zero crossing rate):指语音信号在一定时间窗口内的过零次数,用于描述语音信号的频率特征。


原文地址: http://www.cveoy.top/t/topic/bxTc 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录