Python Pandas数据处理:合并SUM.csv文件中相同销售日期、单品编码和销售类型的销量
使用Python Pandas合并CSV文件中相同条件下的销量数据
本文将介绍如何使用Python的Pandas库处理SUM.csv文件,该文件包含以下列:销售日期, 扫码销售时间, 单品编码, 单品名称, 分类名称, 销量(千克), 销售单价(元/千克), 销售类型, 是否打折销售, 批发价格, 单品损耗率。
目标:
如果销售日期、单品编码和销售类型相同,则将对应行的'销量(千克)'列的值相加,其他列保持不变,并将结果输出到SUMsmall.csv文件。
解决方案:
我们可以使用Pandas库高效地完成这项任务。以下是详细的代码实现和解释:pythonimport pandas as pd
读取SUM.csv文件df = pd.read_csv('SUM.csv')
根据'销售日期', '单品编码'和'销售类型'进行分组,并对'销量(千克)'进行求和df_sum = df.groupby(['销售日期', '单品编码', '销售类型'], as_index=False)['销量(千克)'].sum()
保存处理后的数据为SUMsmall.csv文件df_sum.to_csv('SUMsmall.csv', index=False)
代码解释:
- 导入Pandas库:
import pandas as pd2. 读取CSV文件:df = pd.read_csv('SUM.csv')将SUM.csv文件读取到名为'df'的DataFrame中。3. 分组和求和:df_sum = df.groupby(['销售日期', '单品编码', '销售类型'], as_index=False)['销量(千克)'].sum()- 使用groupby()函数按照 '销售日期', '单品编码' 和 '销售类型' 进行分组。 -as_index=False确保分组列保留为普通列,而不是索引。 - 选择 '销量(千克)' 列并使用sum()函数计算每个分组的总和。4. 保存结果:df_sum.to_csv('SUMsmall.csv', index=False)将处理后的DataFrame保存到名为 'SUMsmall.csv' 的新文件中,index=False避免写入索引列。
通过以上步骤,您就可以使用Python Pandas轻松合并SUM.csv文件中相同销售日期、单品编码和销售类型的数据,并将结果保存到新的CSV文件中。
原文地址: https://www.cveoy.top/t/topic/ejtm 著作权归作者所有。请勿转载和采集!