Pandas agg() 函数:数据聚合操作指南
Pandas 中的 agg() 函数用于对数据进行聚合操作。它可以接受一个或多个聚合函数,并将这些函数应用于指定的列或整个 DataFrame。
使用 agg() 函数的一般语法如下:
df.agg(func, axis=0)
其中,df 是要进行聚合操作的 DataFrame,func 是一个或多个聚合函数,axis 是指定应用聚合函数的轴,默认为 0(按列进行聚合)。
以下是一些常用的 agg() 函数的使用方法:
- 使用内置的聚合函数:
df.agg(['sum', 'mean', 'max'])
这将对 DataFrame 中的每一列分别应用 sum、mean 和 max 函数。
- 使用自定义的聚合函数:
def custom_agg(x):
return x.max() - x.min()
df.agg(custom_agg)
这将对 DataFrame 中的每一列应用自定义的聚合函数 custom_agg。
- 对特定列应用不同的聚合函数:
df.agg({'column1': 'sum', 'column2': ['min', 'max']})
这将对 column1 列应用 sum 函数,对 column2 列应用 min 和 max 函数。
- 对整个 DataFrame 应用聚合函数:
df.agg(np.sum, axis=1)
这将对整个 DataFrame 的每一行应用 sum 函数。
- 对分组数据进行聚合:
df.groupby('column').agg(['sum', 'mean'])
这将对按 column 列进行分组后的每个组应用 sum 和 mean 函数。
这些只是 agg() 函数的一些常见用法,根据具体需求,可以使用不同的聚合函数和参数来完成更复杂的聚合操作。
原文地址: https://www.cveoy.top/t/topic/futs 著作权归作者所有。请勿转载和采集!