可以使用PIL库来重新调整生成的图像大小为(224, 224)。修改代码如下:

import os import librosa import librosa.display import numpy as np from PIL import Image

设置数据集路径

dataset_dir = "D:/论文代码/casia汉语情感语料库/"

循环遍历所有子目录

for subdir, dir, files in os.walk(dataset_dir): for file in files: filepath = os.path.join(subdir, file) # 如果是音频文件,则进行处理 if filepath.endswith(".wav"): # 加载音频文件 y, sr = librosa.load(filepath, sr=None) # 计算对数梅尔谱图 S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128) log_S = librosa.power_to_db(S, ref=np.max) # 画图并保存 plt.figure(figsize=(12,4)) librosa.display.specshow(log_S, sr=sr, x_axis='time', y_axis='mel') plt.title('Mel power spectrogram') plt.colorbar(format='%+02.0f dB') plt.tight_layout() plt.savefig(os.path.join(subdir.replace(dataset_dir, "D:/论文代码/spectrograms/"), file+".png")) plt.close() # 调整图片大小为(224, 224)并保存 img = Image.open(os.path.join(subdir.replace(dataset_dir, "D:/论文代码/spectrograms/"), file+".png")) img = img.resize((224, 224), Image.ANTIALIAS) img.save(os.path.join(subdir.replace(dataset_dir, "D:/论文代码/spectrograms/"), file+".png")

# 设置数据集路径dataset_dir = D论文代码casia汉语情感语料库# 循环遍历所有子目录for subdir dir files in oswalkdataset_dir for file in files filepath = ospathjoinsubdir file # 如果是音频文件则进行处理 if filepathendswi

原文地址: https://www.cveoy.top/t/topic/dRaH 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录