Python 合并多个 Excel 表格 - 完整代码示例

本文将介绍如何使用 Python 语言和 Pandas 库合并多个 Excel 表格。我们将提供一个完整的代码示例,并解释每个步骤。

代码:

import pandas as pd
import os

# 设置要合并的 Excel 文件夹路径
folder_path = './excel_files/'

# 获取文件夹中所有 Excel 文件名
file_names = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 创建一个空的 DataFrame 来存储所有数据
all_data = pd.DataFrame()

# 读取每个 Excel 文件,并将数据添加到 all_data 中
for file_name in file_names:
    file_path = os.path.join(folder_path, file_name)
    data = pd.read_excel(file_path)
    all_data = all_data.append(data, ignore_index=True)

# 将合并后的数据保存到新的 Excel 文件中
output_path = './merged_data.xlsx'
all_data.to_excel(output_path, index=False)

print('合并完成!')

代码解释:

  1. 导入库: 首先,导入 pandas 库用于处理数据,导入 os 库用于文件操作。
  2. 设置文件夹路径: 定义 folder_path 变量,指定要合并的 Excel 文件所在的文件夹路径。
  3. 获取文件名: 使用 os.listdir() 函数获取文件夹中的所有文件名,并使用列表推导式筛选出以 .xlsx 结尾的 Excel 文件名。
  4. 创建空 DataFrame: 创建一个空的 pandas DataFrame all_data 用于存储所有合并后的数据。
  5. 读取并合并数据: 使用循环遍历所有 Excel 文件名,使用 pd.read_excel() 函数读取每个文件的数据,并将数据追加到 all_data DataFrame 中。使用 ignore_index=True 参数确保合并后的数据索引不重复。
  6. 保存合并数据: 使用 to_excel() 函数将合并后的数据保存到一个名为 merged_data.xlsx 的新 Excel 文件中。使用 index=False 参数排除索引列。
  7. 输出提示信息: 在控制台中输出 '合并完成!' 表示合并操作已完成。

注意事项:

  • 该代码假设所有 Excel 文件具有相同的列和列名。如果您的 Excel 文件不满足这个条件,您可能需要对程序进行修改。
  • 您可以根据需要修改 folder_pathoutput_path 变量。

通过以上步骤,您可以轻松使用 Python 合并多个 Excel 表格。

Python 合并多个 Excel 表格 - 完整代码示例

原文地址: https://www.cveoy.top/t/topic/nKhJ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录