Pandas: 使用Python将两个Excel文件列匹配并追加数据

使用Pandas库将两个Excel文件列匹配并追加数据

本教程将演示如何使用Python的Pandas库实现两个Excel文件列匹配，并将匹配结果添加到第一个Excel文件最后列的功能。

代码示例

import pandas as pd

# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')

# 遍历第一个Excel文件的列
for index, row in df1.iterrows():
    # 获取对应的值
    value = row['列名']
    
    # 判断第二个Excel文件的列是否包含对应的值
    if value in df2['列名'].values:
        # 获取对应行的数据
        df2_row = df2.loc[df2['列名'] == value]
        
        # 一一对应添加到第一个Excel文件的最后列的后面
        for col in df2_row.columns:
            df1.loc[index, col] = df2_row[col].values[0]

# 将结果保存到新的Excel文件
df1.to_excel('result.xlsx', index=False)

代码解释

导入Pandas库：使用import pandas as pd语句导入Pandas库。
读取Excel文件：使用pd.read_excel()函数读取两个Excel文件，分别存储在df1和df2变量中。
遍历第一个Excel文件：使用df1.iterrows()遍历第一个Excel文件的所有行。
获取对应值：从当前行获取'列名'的值，存储在value变量中。
判断是否包含：检查value是否在第二个Excel文件的'列名'列中存在。
获取对应行：如果存在，使用df2.loc[df2['列名'] == value]获取第二个Excel文件中对应value的行数据。
一一对应追加：遍历对应行的数据，并将每个值添加到第一个Excel文件的对应行，位于最后列的后面。
保存结果：使用df1.to_excel('result.xlsx', index=False)将结果保存到名为result.xlsx的新Excel文件中。

注意

实际使用时，请将代码中的'file1.xlsx'、'file2.xlsx'、'列名'替换为实际的文件路径和列名。
本代码假设两个Excel文件都包含名为'列名'的列。
如果第二个Excel文件存在重复的'列名'值，本代码将只使用第一个匹配结果。

总结

本教程详细介绍了使用Pandas库实现两个Excel文件列匹配，并将匹配结果添加到第一个Excel文件最后列的功能。使用此方法可以有效地处理两个Excel文件之间的数据关联关系，并实现数据整合。