Python Pandas 读取 Excel 多个工作表教程

在数据分析中,经常需要处理包含多个工作表的 Excel 文件。Python Pandas 库提供了一种高效便捷的方式来读取和处理此类文件。

安装 openpyxl

在开始之前,需要安装 openpyxl 库,它提供了对 Excel 文件的读写支持。可以使用以下命令安装:bashpip install openpyxl

读取 Excel 文件

以下代码演示了如何使用 Pandas 读取包含多个工作表的 Excel 文件:pythonimport pandas as pd

读取 Excel 文件excel_file = pd.ExcelFile('file.xlsx')

获取所有工作表的名称sheet_names = excel_file.sheet_names

创建一个空的列表来存储所有工作表的数据dfs = []

遍历每个工作表,读取数据并存储到列表中for sheet_name in sheet_names: df = excel_file.parse(sheet_name) dfs.append(df)

将所有工作表的数据合并为一个 DataFramemerged_df = pd.concat(dfs)

打印合并后的 DataFrameprint(merged_df)

代码说明:

  1. 首先,使用 pd.ExcelFile() 函数创建一个 ExcelFile 对象,并传入 Excel 文件的路径。2. 使用 sheet_names 属性获取所有工作表的名称列表。3. 创建一个空列表 dfs,用于存储每个工作表读取后的 DataFrame。4. 使用 for 循环遍历每个工作表名称: - 使用 excel_file.parse() 函数读取当前工作表的数据,并将其存储为一个 DataFrame。 - 将 DataFrame 添加到 dfs 列表中。5. 最后,使用 pd.concat() 函数将 dfs 列表中的所有 DataFrame 合并为一个 DataFrame。

注意:

  • 将代码中的 'file.xlsx' 替换为你要读取的 Excel 文件的路径。- 可以根据需要修改代码,例如选择性地读取某些工作表,或对读取的数据进行进一步处理。

总结

通过以上步骤,你可以轻松地使用 Pandas 读取包含多个工作表的 Excel 文件,并对数据进行分析和处理。 Pandas 提供了丰富的功能来处理数据,建议参考官方文档了解更多信息。

Python Pandas 读取 Excel 多个工作表教程

原文地址: https://www.cveoy.top/t/topic/fR5N 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录