Pandas pivot_table 与 groupby 的对比:以销售额为例
Pandas pivot_table 与 groupby 的对比:以销售额为例
Pandas 库提供了 pivot_table 和 groupby 两种方法来进行数据分组和汇总,本文将以销售额数据为例,比较两种方法的应用场景和使用方法。
使用 pivot_table 统计销售额
import pandas as pd
df = pd.DataFrame({ # 假设数据
'省/自治区': ['广东', '广东', '浙江', '浙江', '上海', '上海'],
'类别': ['服装', '食品', '服装', '电子产品', '食品', '电子产品'],
'销售额': [1000, 500, 800, 1200, 600, 900]
})
pivot_table = pd.pivot_table(df, values=['销售额'], index=['省/自治区'], columns='类别', aggfunc='sum')
print(pivot_table)
使用 groupby 统计销售额
import pandas as pd
df = pd.DataFrame({ # 假设数据
'省/自治区': ['广东', '广东', '浙江', '浙江', '上海', '上海'],
'类别': ['服装', '食品', '服装', '电子产品', '食品', '电子产品'],
'销售额': [1000, 500, 800, 1200, 600, 900]
})
grouped = df.groupby(['省/自治区', '类别'])['销售额'].sum()
print(grouped)
总结
pivot_table 和 groupby 在统计销售额数据时,各自有其优势:
pivot_table更适合生成一个类似表格的结构,方便查看不同省份和类别之间的销售额对比。groupby更适合对数据进行多层分组,例如可以根据省份、类别、时间等多个维度进行分组统计。
原文地址: https://www.cveoy.top/t/topic/pfV1 著作权归作者所有。请勿转载和采集!