Python Pandas 批量合并多个文件相同列名数据
可以使用 Python 的 pandas 库来实现对多个文件进行两列列名一致的列的合并。下面是一个简单的示例代码:
import pandas as pd
import glob
# 获取所有需要合并的文件路径
files = glob.glob('path_to_files/*.csv')
# 创建一个空的 DataFrame 用于存储合并后的结果
merged_df = pd.DataFrame()
# 遍历所有文件
for file in files:
# 读取文件
df = pd.read_csv(file)
# 选择需要合并的列(假设为'column1'和'column2')
df_selected = df[['column1', 'column2']]
# 将选中的列合并到结果 DataFrame 中
merged_df = pd.concat([merged_df, df_selected])
# 输出合并后的结果
print(merged_df)
在上述代码中,首先使用glob.glob()函数获取所有需要合并的文件路径,并存储在files列表中。然后创建一个空的 DataFramemerged_df来存储合并后的结果。
接下来,使用for循环遍历所有文件,通过pd.read_csv()函数读取每个文件的数据,并使用[['column1', 'column2']]选择需要合并的列。
最后,使用pd.concat()函数将选中的列合并到merged_df中,并使用print()函数输出合并后的结果。
请根据实际情况修改代码中的文件路径以及需要合并的列名。
原文地址: https://www.cveoy.top/t/topic/o9Cw 著作权归作者所有。请勿转载和采集!