import numpy as npimport librosaimport matplotlibpyplot as pltimport torchimport torchaudioimport torchaudiofunctional as Ffrom torchutilsdata import Datasetclass SpeechDatasetDataset def __init__s
- 导入所需的库
- 定义 SpeechDataset 类,继承自 Dataset 类
- 初始化函数,传入参数 args、noisy_files、clean_files 和 max_len
- 定义 load_sample 函数,用于加载音频文件,返回 waveform 和采样率 sr
- 定义 _prepare_sample 函数,用于将音频 waveform 填充或截断至指定长度 max_len,并返回 tensor 类型的数据
- 定义 len 函数,返回数据集大小
- 定义 getitem 函数,根据索引 idx 加载对应的噪声音频文件和干净音频文件,调用 _prepare_sample 函数进行填充或截断,并返回处理后的数据对 (x_noisy, x_clean)
原文地址: https://www.cveoy.top/t/topic/cyga 著作权归作者所有。请勿转载和采集!