1对时域信号进行预强调然后将其分解为短帧每帧乘以一个汉明窗。
(2)进行快速傅里叶变换,得到频域信号。
(3)对频域信号进行功率谱密度估计,得到每帧的功率谱。
(4)将功率谱应用于梅尔滤波器组,得到每帧的梅尔频谱。
(5)对梅尔频谱进行离散余弦变换,得到每帧的倒谱系数。
(6)将倒谱系数输入到一个声学模型中,得到最终的语音识别结果。
原文地址: https://www.cveoy.top/t/topic/fhc4 著作权归作者所有。请勿转载和采集!
安全问答是一个知识全球问答,包含丰富的问答知识
(2)进行快速傅里叶变换,得到频域信号。
(3)对频域信号进行功率谱密度估计,得到每帧的功率谱。
(4)将功率谱应用于梅尔滤波器组,得到每帧的梅尔频谱。
(5)对梅尔频谱进行离散余弦变换,得到每帧的倒谱系数。
(6)将倒谱系数输入到一个声学模型中,得到最终的语音识别结果。
原文地址: https://www.cveoy.top/t/topic/fhc4 著作权归作者所有。请勿转载和采集!