Pandas的groupby方法用于按照指定的列或条件对数据进行分组。然后可以对每个分组进行聚合操作,如求和、计数、平均值等。

下面是groupby的基本使用方法:

  1. 按照单个列进行分组:
grouped = df.groupby('column_name')
  1. 按照多个列进行分组:
grouped = df.groupby(['column_name1', 'column_name2'])
  1. 对分组进行聚合操作:
grouped.sum()  # 求和
grouped.count()  # 计数
grouped.mean()  # 平均值
grouped.max()  # 最大值
grouped.min()  # 最小值
grouped.aggregate(func)  # 自定义聚合函数
  1. 对分组后的结果进行遍历:
for name, group in grouped:
    print(name)  # 分组的名称
    print(group)  # 分组的数据
  1. 对分组后的结果进行筛选:
grouped.filter(lambda x: x['column_name'].sum() > 100)  # 筛选满足条件的分组

这只是groupby方法的基本使用方法,还有很多高级用法,如应用多个聚合函数、应用不同的聚合函数于不同的列等。可以参考Pandas官方文档获取更多信息。

pandas groupby使用方法

原文地址: https://www.cveoy.top/t/topic/iNiO 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录