Python 合并多个 Excel 表格 - 完整代码示例
Python 合并多个 Excel 表格 - 完整代码示例
本文将介绍如何使用 Python 语言和 Pandas 库合并多个 Excel 表格。我们将提供一个完整的代码示例,并解释每个步骤。
代码:
import pandas as pd
import os
# 设置要合并的 Excel 文件夹路径
folder_path = './excel_files/'
# 获取文件夹中所有 Excel 文件名
file_names = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 创建一个空的 DataFrame 来存储所有数据
all_data = pd.DataFrame()
# 读取每个 Excel 文件,并将数据添加到 all_data 中
for file_name in file_names:
file_path = os.path.join(folder_path, file_name)
data = pd.read_excel(file_path)
all_data = all_data.append(data, ignore_index=True)
# 将合并后的数据保存到新的 Excel 文件中
output_path = './merged_data.xlsx'
all_data.to_excel(output_path, index=False)
print('合并完成!')
代码解释:
- 导入库: 首先,导入
pandas库用于处理数据,导入os库用于文件操作。 - 设置文件夹路径: 定义
folder_path变量,指定要合并的 Excel 文件所在的文件夹路径。 - 获取文件名: 使用
os.listdir()函数获取文件夹中的所有文件名,并使用列表推导式筛选出以.xlsx结尾的 Excel 文件名。 - 创建空 DataFrame: 创建一个空的
pandasDataFrameall_data用于存储所有合并后的数据。 - 读取并合并数据: 使用循环遍历所有 Excel 文件名,使用
pd.read_excel()函数读取每个文件的数据,并将数据追加到all_dataDataFrame 中。使用ignore_index=True参数确保合并后的数据索引不重复。 - 保存合并数据: 使用
to_excel()函数将合并后的数据保存到一个名为merged_data.xlsx的新 Excel 文件中。使用index=False参数排除索引列。 - 输出提示信息: 在控制台中输出 '合并完成!' 表示合并操作已完成。
注意事项:
- 该代码假设所有 Excel 文件具有相同的列和列名。如果您的 Excel 文件不满足这个条件,您可能需要对程序进行修改。
- 您可以根据需要修改
folder_path和output_path变量。
通过以上步骤,您可以轻松使用 Python 合并多个 Excel 表格。
原文地址: https://www.cveoy.top/t/topic/nKhJ 著作权归作者所有。请勿转载和采集!