pandas groupby使用方法
Pandas的groupby方法用于按照指定的列或条件对数据进行分组。然后可以对每个分组进行聚合操作,如求和、计数、平均值等。
下面是groupby的基本使用方法:
- 按照单个列进行分组:
grouped = df.groupby('column_name')
- 按照多个列进行分组:
grouped = df.groupby(['column_name1', 'column_name2'])
- 对分组进行聚合操作:
grouped.sum() # 求和
grouped.count() # 计数
grouped.mean() # 平均值
grouped.max() # 最大值
grouped.min() # 最小值
grouped.aggregate(func) # 自定义聚合函数
- 对分组后的结果进行遍历:
for name, group in grouped:
print(name) # 分组的名称
print(group) # 分组的数据
- 对分组后的结果进行筛选:
grouped.filter(lambda x: x['column_name'].sum() > 100) # 筛选满足条件的分组
这只是groupby方法的基本使用方法,还有很多高级用法,如应用多个聚合函数、应用不同的聚合函数于不同的列等。可以参考Pandas官方文档获取更多信息。
原文地址: https://www.cveoy.top/t/topic/iNiO 著作权归作者所有。请勿转载和采集!