Pandas groupby().agg() 函数详解:聚合操作的强大工具
在df.groupby().agg()中,agg()函数用于对每个分组进行聚合操作。
agg()函数的使用方法如下:
df.groupby(by=group_columns).agg(functions)
其中,by参数指定分组依据的列名或列名的列表。可以是单个列名,也可以是多个列名组成的列表。
functions参数指定对每个分组进行的聚合操作,可以是单个函数或多个函数组成的列表。常用的聚合函数包括sum、mean、max、min、count等。
示例:
df.groupby('column1').agg('sum') # 对column1分组,对其他列求和
df.groupby(['column1','column2']).agg(['sum','mean']) # 对column1和column2分组,对其他列分别求和和均值
agg()函数还可以通过传递自定义函数来进行聚合操作。自定义函数需要接收一个Series对象作为输入,并返回一个标量值作为输出。
示例:
def custom_function(series):
return series.max() - series.min()
df.groupby('column1').agg(custom_function) # 对column1分组,对其他列应用自定义函数
原文地址: https://www.cveoy.top/t/topic/igLd 著作权归作者所有。请勿转载和采集!