这里提供一种使用pandas库进行数据归一化的方法,可以对文件夹中的所有Excel文件进行操作。

首先需要安装pandas库,可以使用以下命令进行安装:

pip install pandas

然后可以使用以下代码实现数据归一化并保存到原来的Excel文件中:

import pandas as pd
import os

# 定义归一化函数
def normalize_data(df):
    return (df - df.min()) / (df.max() - df.min())

# 定义文件夹路径
folder_path = './data/'

# 获取文件夹下的所有Excel文件
files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 遍历Excel文件进行归一化
for file in files:
    file_path = os.path.join(folder_path, file)
    # 读取Excel文件
    df = pd.read_excel(file_path)
    # 对数据进行归一化
    df_normalized = df.apply(normalize_data)
    # 将归一化后的数据保存到原来的Excel文件中
    with pd.ExcelWriter(file_path) as writer:
        df_normalized.to_excel(writer, index=False, sheet_name='Sheet1')

在上述代码中,我们首先定义了一个归一化函数normalize_data,使用pandas库的min()max()方法计算每列数据的最小值和最大值,然后对数据进行归一化处理。

然后,我们指定了文件夹路径folder_path,并使用os.listdir()方法获取文件夹中所有以.xlsx结尾的Excel文件。

接下来,我们遍历每个Excel文件,使用pd.read_excel()方法读取数据,并对数据进行归一化处理。最后,使用pd.ExcelWriter()方法将归一化后的数据保存到原来的Excel文件中。注意,我们使用with语句打开ExcelWriter,这样可以自动关闭文件,避免资源泄漏。

运行以上代码后,文件夹中所有Excel文件中的数据都会被归一化,并保存到原来的Excel文件中

使用python对文件夹里的多个excel进行数据归一化并保存到原来的excel中

原文地址: https://www.cveoy.top/t/topic/fQ5x 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录