现有一个dataframe其中记录了站点号以及其对应的flag现有一个新的大csv要根据该csv中的站点列新建flag列其flag值参照dataframe中站点号和flag的对应关系
您可以使用pandas库中的merge函数将两个DataFrame合并,根据站点号进行匹配,并添加新的flag列。
假设您的dataframe命名为df1,其中包含两列:站点号(station)和flag。新的大csv文件命名为csv_file,其中包含一列站点号(station)。
首先,读取csv文件并将其存储为一个DataFrame对象df2:
import pandas as pd
df2 = pd.read_csv('csv_file.csv')
然后,使用merge函数将df1和df2合并,根据站点号(station)进行匹配,并将flag列添加到df2中:
df3 = pd.merge(df2, df1, on='station', how='left')
在这里,我们使用了left连接(how='left'),这意味着只保留df2中的站点号,如果df2中的站点号在df1中找不到对应的flag,则使用NaN填充。
最后,将df3保存为一个新的csv文件:
df3.to_csv('new_csv_file.csv', index=False)
这样,您就可以得到一个新的csv文件new_csv_file,其中包含站点号和根据dataframe中的对应关系新建的flag列
原文地址: https://www.cveoy.top/t/topic/iXxL 著作权归作者所有。请勿转载和采集!