import librosaimport numpy as np# 读取音频文件audio_file = infilemp3y sr = librosaloadaudio_file# 提取音频的短时傅里叶变换STFTD = librosastfty# 计算音频的能量谱power_spec = npabsD2# 选择一个适当的阈值进行二值化threshold = npmaxpower_spec 0

日期: 2027-11-03

标签: 科技

上述代码使用Librosa库来实现音频分离。首先，通过librosa.load函数读取音频文件，并返回音频数据和采样率。然后，使用librosa.stft函数提取音频的短时傅里叶变换（STFT）。接下来，计算音频的能量谱，并选择一个适当的阈值进行二值化。然后，将原始STFT乘以二值掩码得到分离后的STFT。最后，使用librosa.istft函数将分离后的STFT转换为时域信号，并可选择保存分离出的人声音频。

import librosaimport numpy as np# 读取音频文件audio_file = infilemp3y sr = librosaloadaudio_file# 提取音频的短时傅里叶变换STFTD = librosastfty# 计算音频的能量谱power_spec = npabsD2# 选择一个适当的阈值进行二值化threshold = npmaxpower_spec 0

原文地址: http://www.cveoy.top/t/topic/h1Gh 著作权归作者所有。请勿转载和采集!