使用python对文件夹里的多个excel进行数据归一化
以下是一个简单的示例代码,可以将指定文件夹中的所有Excel文件中的数据进行归一化处理。
import os
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
# 指定文件夹路径
folder_path = "path/to/folder"
# 获取文件夹中所有Excel文件的文件名
file_names = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 循环遍历所有文件,并进行数据归一化处理
for file_name in file_names:
# 读取Excel文件
file_path = os.path.join(folder_path, file_name)
df = pd.read_excel(file_path)
# 进行数据归一化处理
scaler = MinMaxScaler()
df_normalized = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)
# 将处理后的数据保存到新的Excel文件中
normalized_file_name = file_name[:-5] + "_normalized.xlsx" # 新文件名
normalized_file_path = os.path.join(folder_path, normalized_file_name) # 新文件路径
df_normalized.to_excel(normalized_file_path, index=False)
这段代码使用了pandas库来读取和保存Excel文件,使用了sklearn库中的MinMaxScaler来进行数据归一化处理。在处理过程中,会先读取Excel文件,然后进行归一化处理,最后将处理后的数据保存到新的Excel文件中。同时,也会对文件名进行修改,用以表示这是处理后的文件
原文地址: https://www.cveoy.top/t/topic/fQ4H 著作权归作者所有。请勿转载和采集!