Pandas pivot_table 与 groupby 的对比:以销售额为例

Pandas 库提供了 pivot_tablegroupby 两种方法来进行数据分组和汇总,本文将以销售额数据为例,比较两种方法的应用场景和使用方法。

使用 pivot_table 统计销售额

import pandas as pd

df = pd.DataFrame({  # 假设数据
    '省/自治区': ['广东', '广东', '浙江', '浙江', '上海', '上海'],
    '类别': ['服装', '食品', '服装', '电子产品', '食品', '电子产品'],
    '销售额': [1000, 500, 800, 1200, 600, 900]
})

pivot_table = pd.pivot_table(df, values=['销售额'], index=['省/自治区'], columns='类别', aggfunc='sum')
print(pivot_table)

使用 groupby 统计销售额

import pandas as pd

df = pd.DataFrame({  # 假设数据
    '省/自治区': ['广东', '广东', '浙江', '浙江', '上海', '上海'],
    '类别': ['服装', '食品', '服装', '电子产品', '食品', '电子产品'],
    '销售额': [1000, 500, 800, 1200, 600, 900]
})

grouped = df.groupby(['省/自治区', '类别'])['销售额'].sum()
print(grouped)

总结

pivot_tablegroupby 在统计销售额数据时,各自有其优势:

  • pivot_table 更适合生成一个类似表格的结构,方便查看不同省份和类别之间的销售额对比。
  • groupby 更适合对数据进行多层分组,例如可以根据省份、类别、时间等多个维度进行分组统计。
Pandas pivot_table 与 groupby 的对比:以销售额为例

原文地址: https://www.cveoy.top/t/topic/pfV1 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录