使用Python Pandas合并CSV文件中相同条件下的销量数据

本文将介绍如何使用Python的Pandas库处理SUM.csv文件，该文件包含以下列：销售日期, 扫码销售时间, 单品编码, 单品名称, 分类名称, 销量(千克), 销售单价(元/千克), 销售类型, 是否打折销售, 批发价格, 单品损耗率。

目标：

如果销售日期、单品编码和销售类型相同，则将对应行的'销量(千克)'列的值相加，其他列保持不变，并将结果输出到SUMsmall.csv文件。

解决方案：

我们可以使用Pandas库高效地完成这项任务。以下是详细的代码实现和解释：pythonimport pandas as pd

读取SUM.csv文件df = pd.read_csv('SUM.csv')

代码解释：

导入Pandas库： import pandas as pd2. 读取CSV文件： df = pd.read_csv('SUM.csv') 将SUM.csv文件读取到名为'df'的DataFrame中。3. 分组和求和： df_sum = df.groupby(['销售日期', '单品编码', '销售类型'], as_index=False)['销量(千克)'].sum() - 使用 groupby() 函数按照 '销售日期', '单品编码' 和 '销售类型' 进行分组。 - as_index=False 确保分组列保留为普通列，而不是索引。 - 选择 '销量(千克)' 列并使用 sum() 函数计算每个分组的总和。4. 保存结果： df_sum.to_csv('SUMsmall.csv', index=False) 将处理后的DataFrame保存到名为 'SUMsmall.csv' 的新文件中，index=False 避免写入索引列。

通过以上步骤，您就可以使用Python Pandas轻松合并SUM.csv文件中相同销售日期、单品编码和销售类型的数据，并将结果保存到新的CSV文件中。