本代码实现了Mel-spectrogram/PCEN的特征提取,生成训练集和验证集的数据集。主要函数包括:

  • create_dataset:根据提供的onset-offset注释和音频信号提取特征,并将其分割成一定长度的片段。
  • Feature_Extractor:从音频中提取Mel-spectrogram/PCEN特征。
  • extract_feature:从音频路径中提取特征。
  • time_2_frame:将时间戳转换为帧数。
  • feature_transform:在训练和验证模式下,提取特征并生成数据集。

这些函数都是为了生成数据集而设计的,是基于提供的注释和音频信号进行特征提取和切片的。其中,feature_transform函数是主要函数,它会根据训练和验证模式选择相应的路径,并使用create_dataset函数对注释和音频信号进行特征提取和切片,最终生成数据集。

def create_datasetdf_pospcenglob_cls_namefile_namehfseg_lenhop_segfps - label_list list of labels for the extracted mel patches label_list = if lenhffeatures == 0 file_index = 0

原文地址: https://www.cveoy.top/t/topic/ef9R 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录