Python Pandas 读取 Excel 多个工作表教程
Python Pandas 读取 Excel 多个工作表教程
在数据分析中,经常需要处理包含多个工作表的 Excel 文件。Python Pandas 库提供了一种高效便捷的方式来读取和处理此类文件。
安装 openpyxl
在开始之前,需要安装 openpyxl 库,它提供了对 Excel 文件的读写支持。可以使用以下命令安装:bashpip install openpyxl
读取 Excel 文件
以下代码演示了如何使用 Pandas 读取包含多个工作表的 Excel 文件:pythonimport pandas as pd
读取 Excel 文件excel_file = pd.ExcelFile('file.xlsx')
获取所有工作表的名称sheet_names = excel_file.sheet_names
创建一个空的列表来存储所有工作表的数据dfs = []
遍历每个工作表,读取数据并存储到列表中for sheet_name in sheet_names: df = excel_file.parse(sheet_name) dfs.append(df)
将所有工作表的数据合并为一个 DataFramemerged_df = pd.concat(dfs)
打印合并后的 DataFrameprint(merged_df)
代码说明:
- 首先,使用 
pd.ExcelFile()函数创建一个 ExcelFile 对象,并传入 Excel 文件的路径。2. 使用sheet_names属性获取所有工作表的名称列表。3. 创建一个空列表dfs,用于存储每个工作表读取后的 DataFrame。4. 使用for循环遍历每个工作表名称: - 使用excel_file.parse()函数读取当前工作表的数据,并将其存储为一个 DataFrame。 - 将 DataFrame 添加到dfs列表中。5. 最后,使用pd.concat()函数将dfs列表中的所有 DataFrame 合并为一个 DataFrame。 
注意:
- 将代码中的 'file.xlsx' 替换为你要读取的 Excel 文件的路径。- 可以根据需要修改代码,例如选择性地读取某些工作表,或对读取的数据进行进一步处理。
 
总结
通过以上步骤,你可以轻松地使用 Pandas 读取包含多个工作表的 Excel 文件,并对数据进行分析和处理。 Pandas 提供了丰富的功能来处理数据,建议参考官方文档了解更多信息。
原文地址: https://www.cveoy.top/t/topic/fR5N 著作权归作者所有。请勿转载和采集!