写一个python脚本使用pandas库读取results-20230630t1147-processingcsv文件将文件中的每行按该行第4列的数字数N重复打印N次重复打印时createdAt列递增。最后输出到training-data-prd-generated-by-pythoncsv
下面是一个使用pandas库的Python脚本,读取“results-20230630t1147-processing.csv"文件,根据每行第4列的数字数N重复打印N次,并且重复打印时“createdAt”列递增。最后将结果输出到training-data-prd-generated-by-python.csv文件。
import pandas as pd
# 读取原始文件
df = pd.read_csv('results-20230630t1147-processing.csv')
# 创建空的DataFrame用于存储结果
result = pd.DataFrame()
# 遍历每一行
for index, row in df.iterrows():
N = int(row[3]) # 获取第4列的数字数N
repeated_rows = pd.DataFrame([row] * N) # 将当前行重复N次
repeated_rows['createdAt'] = pd.date_range(start=row['createdAt'], periods=N) # 递增“createdAt”列
result = result.append(repeated_rows) # 将重复的行添加到结果中
# 将结果输出到文件
result.to_csv('training-data-prd-generated-by-python.csv', index=False)
请确保在运行脚本之前已经安装了pandas库
原文地址: http://www.cveoy.top/t/topic/hDNw 著作权归作者所有。请勿转载和采集!