Pandas: 合并重复工序和物料编码并累加面积
您可以使用Pandas库来处理这个问题。首先,您需要导入Pandas库和Excel文件:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('your_excel_file.xlsx')
然后,您可以根据列工序的值和物料编码PS的值进行分组,对位置的值进行合并,并对PS面积的值进行相加。同时,您可以将工序列改为PS工序,位置改为PS位置:
# 根据列工序的值和物料编码PS的值进行分组
grouped = df.groupby(['工序', '物料编码PS'])
# 合并位置的值并对PS面积的值进行相加
df_new = grouped.agg({'位置': lambda x: ','.join(set(x)), 'PS面积': 'sum'})
# 重命名工序列为PS工序,位置列为PS位置
df_new.rename(columns={'工序': 'PS工序', '位置': 'PS位置'}, inplace=True)
最后,您可以将新的DataFrame保存到新的Excel文件中:
# 保存到新的Excel文件
df_new.to_excel('new_excel_file.xlsx', index=False)
完整的代码如下:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('your_excel_file.xlsx')
# 根据列工序的值和物料编码PS的值进行分组
grouped = df.groupby(['工序', '物料编码PS'])
# 合并位置的值并对PS面积的值进行相加
df_new = grouped.agg({'位置': lambda x: ','.join(set(x)), 'PS面积': 'sum'})
# 重命名工序列为PS工序,位置列为PS位置
df_new.rename(columns={'工序': 'PS工序', '位置': 'PS位置'}, inplace=True)
# 保存到新的Excel文件
df_new.to_excel('new_excel_file.xlsx', index=False)
请将代码中的your_excel_file.xlsx替换为实际的Excel文件路径,并将new_excel_file.xlsx替换为您希望保存的新的Excel文件路径。
原文地址: https://www.cveoy.top/t/topic/njHK 著作权归作者所有。请勿转载和采集!