使用Pandas库将两个Excel文件列匹配并追加数据

本教程将演示如何使用Python的Pandas库实现两个Excel文件列匹配,并将匹配结果添加到第一个Excel文件最后列的功能。

代码示例

import pandas as pd

# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')

# 遍历第一个Excel文件的列
for index, row in df1.iterrows():
    # 获取对应的值
    value = row['列名']
    
    # 判断第二个Excel文件的列是否包含对应的值
    if value in df2['列名'].values:
        # 获取对应行的数据
        df2_row = df2.loc[df2['列名'] == value]
        
        # 一一对应添加到第一个Excel文件的最后列的后面
        for col in df2_row.columns:
            df1.loc[index, col] = df2_row[col].values[0]

# 将结果保存到新的Excel文件
df1.to_excel('result.xlsx', index=False)

代码解释

  1. 导入Pandas库:使用import pandas as pd语句导入Pandas库。
  2. 读取Excel文件:使用pd.read_excel()函数读取两个Excel文件,分别存储在df1df2变量中。
  3. 遍历第一个Excel文件:使用df1.iterrows()遍历第一个Excel文件的所有行。
  4. 获取对应值:从当前行获取'列名'的值,存储在value变量中。
  5. 判断是否包含:检查value是否在第二个Excel文件的'列名'列中存在。
  6. 获取对应行:如果存在,使用df2.loc[df2['列名'] == value]获取第二个Excel文件中对应value的行数据。
  7. 一一对应追加:遍历对应行的数据,并将每个值添加到第一个Excel文件的对应行,位于最后列的后面。
  8. 保存结果:使用df1.to_excel('result.xlsx', index=False)将结果保存到名为result.xlsx的新Excel文件中。

注意

  • 实际使用时,请将代码中的'file1.xlsx''file2.xlsx''列名'替换为实际的文件路径和列名。
  • 本代码假设两个Excel文件都包含名为'列名'的列。
  • 如果第二个Excel文件存在重复的'列名'值,本代码将只使用第一个匹配结果。

总结

本教程详细介绍了使用Pandas库实现两个Excel文件列匹配,并将匹配结果添加到第一个Excel文件最后列的功能。使用此方法可以有效地处理两个Excel文件之间的数据关联关系,并实现数据整合。

Pandas: 使用Python将两个Excel文件列匹配并追加数据

原文地址: https://www.cveoy.top/t/topic/qEL0 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录