使用pythonsklearn库对文件夹里的多个excel进行数据归一化并保存到原来的excel中
以下是使用Python和sklearn库对文件夹中的多个Excel进行数据归一化并保存到原始Excel中的示例代码:
import os
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
# 设置文件夹路径
folder_path = "/path/to/folder"
# 获取文件夹中的所有文件名
file_names = os.listdir(folder_path)
# 对每个文件进行数据归一化
for file_name in file_names:
# 仅处理Excel文件
if file_name.endswith(".xlsx") or file_name.endswith(".xls"):
# 读取Excel文件
excel_path = os.path.join(folder_path, file_name)
df = pd.read_excel(excel_path)
# 使用MinMaxScaler进行数据归一化
scaler = MinMaxScaler()
df_normalized = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)
# 保存归一化后的数据到原始Excel文件
with pd.ExcelWriter(excel_path, engine='openpyxl', mode='a') as writer:
df_normalized.to_excel(writer, sheet_name='Normalized', index=False)
该代码将使用MinMaxScaler对每个Excel文件中的数据进行归一化,然后将归一化后的数据保存到原始Excel文件的新工作表“规范化”中。注意,在保存时使用了openpyxl引擎和“追加”模式,以确保数据不会覆盖原始工作表
原文地址: https://www.cveoy.top/t/topic/fQ6d 著作权归作者所有。请勿转载和采集!