Pandas 中的 agg() 函数用于对数据进行聚合操作。它可以接受一个或多个聚合函数,并将这些函数应用于指定的列或整个 DataFrame。

使用 agg() 函数的一般语法如下:

df.agg(func, axis=0)

其中,df 是要进行聚合操作的 DataFrame,func 是一个或多个聚合函数,axis 是指定应用聚合函数的轴,默认为 0(按列进行聚合)。

以下是一些常用的 agg() 函数的使用方法:

  1. 使用内置的聚合函数:
df.agg(['sum', 'mean', 'max'])

这将对 DataFrame 中的每一列分别应用 sum、mean 和 max 函数。

  1. 使用自定义的聚合函数:
def custom_agg(x):
    return x.max() - x.min()

df.agg(custom_agg)

这将对 DataFrame 中的每一列应用自定义的聚合函数 custom_agg。

  1. 对特定列应用不同的聚合函数:
df.agg({'column1': 'sum', 'column2': ['min', 'max']})

这将对 column1 列应用 sum 函数,对 column2 列应用 min 和 max 函数。

  1. 对整个 DataFrame 应用聚合函数:
df.agg(np.sum, axis=1)

这将对整个 DataFrame 的每一行应用 sum 函数。

  1. 对分组数据进行聚合:
df.groupby('column').agg(['sum', 'mean'])

这将对按 column 列进行分组后的每个组应用 sum 和 mean 函数。

这些只是 agg() 函数的一些常见用法,根据具体需求,可以使用不同的聚合函数和参数来完成更复杂的聚合操作。

Pandas agg() 函数:数据聚合操作指南

原文地址: https://www.cveoy.top/t/topic/futs 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录