Python Sklearn 数据归一化:批量处理 Excel 文件
以下是使用 Python 和 sklearn 库对文件夹中的多个 Excel 进行数据归一化并保存到原始 Excel 中的示例代码:
import os
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
# 设置文件夹路径
folder_path = '/path/to/folder'
# 获取文件夹中的所有文件名
file_names = os.listdir(folder_path)
# 对每个文件进行数据归一化
for file_name in file_names:
# 仅处理 Excel 文件
if file_name.endswith('.xlsx') or file_name.endswith('.xls'):
# 读取 Excel 文件
excel_path = os.path.join(folder_path, file_name)
df = pd.read_excel(excel_path)
# 使用 MinMaxScaler 进行数据归一化
scaler = MinMaxScaler()
df_normalized = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)
# 保存归一化后的数据到原始 Excel 文件
with pd.ExcelWriter(excel_path, engine='openpyxl', mode='a') as writer:
df_normalized.to_excel(writer, sheet_name='Normalized', index=False)
该代码将使用 MinMaxScaler 对每个 Excel 文件中的数据进行归一化,然后将归一化后的数据保存到原始 Excel 文件的新工作表 '规范化' 中。注意,在保存时使用了 openpyxl 引擎和 '追加' 模式,以确保数据不会覆盖原始工作表。
原文地址: https://www.cveoy.top/t/topic/oqXf 著作权归作者所有。请勿转载和采集!