pandas合并为一个表
可以使用pandas的merge函数将多个表合并为一个表。
例如,假设有两个表df1和df2,它们分别如下所示:
df1:
| ID | Name | Age | |----|------|-----| | 1 | John | 25 | | 2 | Mary | 30 | | 3 | Alex | 27 |
df2:
| ID | Salary | Department | |----|--------|------------| | 1 | 5000 | IT | | 2 | 6000 | HR | | 4 | 7000 | Sales |
我们可以使用merge函数将这两个表合并为一个表,代码如下:
merged_df = pd.merge(df1, df2, on='ID', how='outer')
其中,on参数指定合并的键(即ID列),how参数指定合并方式(outer表示并集,即保留所有行,左右两个表中没有的值用NaN填充),合并后的结果如下:
| ID | Name | Age | Salary | Department | |----|------|-----|--------|------------| | 1 | John | 25 | 5000 | IT | | 2 | Mary | 30 | 6000 | HR | | 3 | Alex | 27 | NaN | NaN | | 4 | NaN | NaN | 7000 | Sales |
注意,在合并时需要确保合并的键在两个表中都存在,否则会出现错误。另外,如果两个表中有重复的键,需要使用suffixes参数指定列名后缀,以区分这些列。
原文地址: https://www.cveoy.top/t/topic/MEB 著作权归作者所有。请勿转载和采集!