import numpy as npimport librosaimport matplotlibpyplot as pltimport torchimport torchaudioimport torchaudiofunctional as Ffrom torchutilsdata import Datasetclass SpeechDatasetDataset def __init__s

日期: 2024-08-05

标签: 科技

导入所需的库
定义 SpeechDataset 类，继承自 Dataset 类
初始化函数，传入参数 args、noisy_files、clean_files 和 max_len
定义 load_sample 函数，用于加载音频文件，返回 waveform 和采样率 sr
定义 _prepare_sample 函数，用于将音频 waveform 填充或截断至指定长度 max_len，并返回 tensor 类型的数据
定义 len 函数，返回数据集大小
定义 getitem 函数，根据索引 idx 加载对应的噪声音频文件和干净音频文件，调用 _prepare_sample 函数进行填充或截断，并返回处理后的数据对 (x_noisy, x_clean)

原文地址: http://www.cveoy.top/t/topic/cyga 著作权归作者所有。请勿转载和采集!