Pandas: 使用Python将两个Excel文件列匹配并追加数据
使用Pandas库将两个Excel文件列匹配并追加数据
本教程将演示如何使用Python的Pandas库实现两个Excel文件列匹配,并将匹配结果添加到第一个Excel文件最后列的功能。
代码示例
import pandas as pd
# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')
# 遍历第一个Excel文件的列
for index, row in df1.iterrows():
# 获取对应的值
value = row['列名']
# 判断第二个Excel文件的列是否包含对应的值
if value in df2['列名'].values:
# 获取对应行的数据
df2_row = df2.loc[df2['列名'] == value]
# 一一对应添加到第一个Excel文件的最后列的后面
for col in df2_row.columns:
df1.loc[index, col] = df2_row[col].values[0]
# 将结果保存到新的Excel文件
df1.to_excel('result.xlsx', index=False)
代码解释
- 导入Pandas库:使用
import pandas as pd语句导入Pandas库。 - 读取Excel文件:使用
pd.read_excel()函数读取两个Excel文件,分别存储在df1和df2变量中。 - 遍历第一个Excel文件:使用
df1.iterrows()遍历第一个Excel文件的所有行。 - 获取对应值:从当前行获取
'列名'的值,存储在value变量中。 - 判断是否包含:检查
value是否在第二个Excel文件的'列名'列中存在。 - 获取对应行:如果存在,使用
df2.loc[df2['列名'] == value]获取第二个Excel文件中对应value的行数据。 - 一一对应追加:遍历对应行的数据,并将每个值添加到第一个Excel文件的对应行,位于最后列的后面。
- 保存结果:使用
df1.to_excel('result.xlsx', index=False)将结果保存到名为result.xlsx的新Excel文件中。
注意
- 实际使用时,请将代码中的
'file1.xlsx'、'file2.xlsx'、'列名'替换为实际的文件路径和列名。 - 本代码假设两个Excel文件都包含名为
'列名'的列。 - 如果第二个Excel文件存在重复的
'列名'值,本代码将只使用第一个匹配结果。
总结
本教程详细介绍了使用Pandas库实现两个Excel文件列匹配,并将匹配结果添加到第一个Excel文件最后列的功能。使用此方法可以有效地处理两个Excel文件之间的数据关联关系,并实现数据整合。
原文地址: https://www.cveoy.top/t/topic/qEL0 著作权归作者所有。请勿转载和采集!