Python Pandas数据处理:合并SUM.csv文件中相同销售日期、单品编码和销售类型的销量
使用Python Pandas合并CSV文件中相同条件下的销量数据
本文将介绍如何使用Python的Pandas库处理SUM.csv文件,该文件包含以下列:
- 销售日期
- 扫码销售时间
- 单品编码
- 单品名称
- 分类名称
- 销量(千克)
- 销售单价(元/千克)
- 销售类型
- 是否打折销售
- 批发价格
- 单品损耗率
目标是将相同销售日期、相同单品编码以及相同销售类型的记录合并,并将它们的'销量(千克)'相加,其他列保持不变,最后将结果输出到SUMsmall.csv文件。
以下是使用Python Pandas实现此目标的代码示例:
import pandas as pd
# 读取SUM.csv文件
df = pd.read_csv('SUM.csv')
# 根据销售日期、单品编码和销售类型分组,并计算销量的总和
df_grouped = df.groupby(['销售日期', '单品编码', '销售类型']).agg({'销量(千克)': 'sum'}).reset_index()
# 将计算结果保存到SUMsmall.csv文件
df_grouped.to_csv('SUMsmall.csv', index=False)
代码解释:
- 导入Pandas库:
import pandas as pd- 导入Pandas库并将其命名为pd,以便在代码中使用。 - 读取CSV文件:
df = pd.read_csv('SUM.csv')- 使用read_csv()函数读取SUM.csv文件,并将其存储在名为df的DataFrame对象中。 - 分组和聚合:
df_grouped = df.groupby(['销售日期', '单品编码', '销售类型']).agg({'销量(千克)': 'sum'}).reset_index()- 使用
groupby()方法根据'销售日期'、'单品编码'和'销售类型'对数据进行分组。 - 使用
agg()方法对每个组应用聚合函数,这里使用{'销量(千克)': 'sum'}将'销量(千克)'列的值求和。 - 使用
reset_index()方法重置索引,以便将结果保存为DataFrame对象。
- 使用
- 保存结果:
df_grouped.to_csv('SUMsmall.csv', index=False)- 使用to_csv()方法将DataFrame对象保存为SUMsmall.csv文件,并通过index=False参数指定不保存索引列。
运行这段代码后,你将在相同目录下获得一个名为SUMsmall.csv的文件,其中包含根据销售日期、单品编码和销售类型合并后的销量数据。
原文地址: https://www.cveoy.top/t/topic/ejg1 著作权归作者所有。请勿转载和采集!