使用Python Pandas合并CSV文件中相同条件下的销量数据

本文将介绍如何使用Python的Pandas库处理SUM.csv文件,该文件包含以下列:

  • 销售日期
  • 扫码销售时间
  • 单品编码
  • 单品名称
  • 分类名称
  • 销量(千克)
  • 销售单价(元/千克)
  • 销售类型
  • 是否打折销售
  • 批发价格
  • 单品损耗率

目标是将相同销售日期、相同单品编码以及相同销售类型的记录合并,并将它们的'销量(千克)'相加,其他列保持不变,最后将结果输出到SUMsmall.csv文件。

以下是使用Python Pandas实现此目标的代码示例:

import pandas as pd

# 读取SUM.csv文件
df = pd.read_csv('SUM.csv')

# 根据销售日期、单品编码和销售类型分组,并计算销量的总和
df_grouped = df.groupby(['销售日期', '单品编码', '销售类型']).agg({'销量(千克)': 'sum'}).reset_index()

# 将计算结果保存到SUMsmall.csv文件
df_grouped.to_csv('SUMsmall.csv', index=False)

代码解释:

  1. 导入Pandas库: import pandas as pd - 导入Pandas库并将其命名为pd,以便在代码中使用。
  2. 读取CSV文件: df = pd.read_csv('SUM.csv') - 使用read_csv()函数读取SUM.csv文件,并将其存储在名为df的DataFrame对象中。
  3. 分组和聚合: df_grouped = df.groupby(['销售日期', '单品编码', '销售类型']).agg({'销量(千克)': 'sum'}).reset_index()
    • 使用groupby()方法根据'销售日期'、'单品编码'和'销售类型'对数据进行分组。
    • 使用agg()方法对每个组应用聚合函数,这里使用{'销量(千克)': 'sum'} 将'销量(千克)'列的值求和。
    • 使用reset_index()方法重置索引,以便将结果保存为DataFrame对象。
  4. 保存结果: df_grouped.to_csv('SUMsmall.csv', index=False) - 使用to_csv()方法将DataFrame对象保存为SUMsmall.csv文件,并通过index=False参数指定不保存索引列。

运行这段代码后,你将在相同目录下获得一个名为SUMsmall.csv的文件,其中包含根据销售日期、单品编码和销售类型合并后的销量数据。

Python Pandas数据处理:合并SUM.csv文件中相同销售日期、单品编码和销售类型的销量

原文地址: https://www.cveoy.top/t/topic/ejg1 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录