Pandas教程:df.groupby('列名').size() 用法详解

在使用 Pandas 进行数据分析时,我们经常需要根据某一列对数据进行分组,并统计每个分组的大小。df.groupby('列名').size() 方法正是为此而生。

功能介绍

df.groupby('列名').size() 方法会将 DataFrame 按照指定的 '列名' 进行分组,并计算每个分组中数据出现的次数,最终返回一个 Series 对象,其中索引为分组的唯一值,对应的值为该分组的大小。

案例分析

假设我们有一个名为 df2 的 DataFrame,其中包含 '学校名称' 和 '学生姓名' 两列:

| 学校名称 | 学生姓名 ||---|---|| 清华大学 | 张三 || 北京大学 | 李四 || 清华大学 | 王五 || 北京大学 | 赵六 || 复旦大学 | 孙七 |

执行 df2.groupby('学校名称').size() 后,会得到如下结果:

学校名称北京大学 2复旦大学 1清华大学 2dtype: int64

结果解读:

  • '北京大学' 出现了 2 次。* '复旦大学' 出现了 1 次。* '清华大学' 出现了 2 次。

实际应用

df.groupby('列名').size() 方法在实际数据分析中应用广泛,例如:

  • 统计不同产品的销售数量。* 分析用户在不同平台的活跃度。* 计算不同地区的订单数量等。

希望通过本文的介绍,您对 Pandas 中 df.groupby('列名').size() 方法有了更深入的理解。该方法简单易用,是进行数据分组和统计分析的利器。

Pandas教程:df.groupby('列名').size() 用法详解

原文地址: http://www.cveoy.top/t/topic/e48O 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录