Python Pandas Excel 表格数据比对教程
要对两个 Excel 表格中的某个工作表数据进行比对,可以使用'pandas'库来读取相应的工作表,并执行数据比对操作。以下是一个示例代码:
import pandas as pd
# 读取第一个 Excel 文件的指定工作表
df1 = pd.read_excel('file1.xlsx', sheet_name='Sheet1')
# 读取第二个 Excel 文件的指定工作表
df2 = pd.read_excel('file2.xlsx', sheet_name='Sheet1')
# 使用 merge 函数基于某一列进行比对
merged_df = pd.merge(df1, df2, on='column_name', how='outer')
# 根据比对结果进行处理或分析
# 示例:筛选出不匹配的行
mismatched_rows = merged_df[merged_df['column_name_x'] != merged_df['column_name_y']]
# 输出不匹配的行
print(mismatched_rows)
在上述代码中,使用'pd.read_excel'函数分别读取第一个 Excel 文件和第二个 Excel 文件的工作表。通过指定'sheet_name'参数来选择要读取的工作表,'Sheet1'应替换为实际的工作表名称。然后,使用'merge'函数将两个 DataFrame 基于某一列进行比对,并将比对结果存储在'merged_df'中。你可以根据比对结果进行进一步的处理或分析,例如筛选出不匹配的行。
请将'file1.xlsx'和'file2.xlsx'替换为实际的 Excel 文件路径,'Sheet1'替换为要比对的工作表名称,以及'column_name'替换为用于比对的列名。根据具体需求进行进一步的数据处理或分析。
确保'pandas'库已经安装好。
原文地址: https://www.cveoy.top/t/topic/FJJ 著作权归作者所有。请勿转载和采集!