使用python对文件夹里的多个excel进行数据归一化并保存到原来的excel中
这里提供一种使用pandas库进行数据归一化的方法,可以对文件夹中的所有Excel文件进行操作。
首先需要安装pandas库,可以使用以下命令进行安装:
pip install pandas
然后可以使用以下代码实现数据归一化并保存到原来的Excel文件中:
import pandas as pd
import os
# 定义归一化函数
def normalize_data(df):
return (df - df.min()) / (df.max() - df.min())
# 定义文件夹路径
folder_path = './data/'
# 获取文件夹下的所有Excel文件
files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 遍历Excel文件进行归一化
for file in files:
file_path = os.path.join(folder_path, file)
# 读取Excel文件
df = pd.read_excel(file_path)
# 对数据进行归一化
df_normalized = df.apply(normalize_data)
# 将归一化后的数据保存到原来的Excel文件中
with pd.ExcelWriter(file_path) as writer:
df_normalized.to_excel(writer, index=False, sheet_name='Sheet1')
在上述代码中,我们首先定义了一个归一化函数normalize_data,使用pandas库的min()和max()方法计算每列数据的最小值和最大值,然后对数据进行归一化处理。
然后,我们指定了文件夹路径folder_path,并使用os.listdir()方法获取文件夹中所有以.xlsx结尾的Excel文件。
接下来,我们遍历每个Excel文件,使用pd.read_excel()方法读取数据,并对数据进行归一化处理。最后,使用pd.ExcelWriter()方法将归一化后的数据保存到原来的Excel文件中。注意,我们使用with语句打开ExcelWriter,这样可以自动关闭文件,避免资源泄漏。
运行以上代码后,文件夹中所有Excel文件中的数据都会被归一化,并保存到原来的Excel文件中
原文地址: https://www.cveoy.top/t/topic/fQ5x 著作权归作者所有。请勿转载和采集!