Python Pandas 脚本:根据列值重复打印数据并递增日期
以下是一个使用 Python Pandas 库的脚本,用于读取 'results-20230630t1147-processing.csv' 文件,根据每行第 4 列的数字 N 重复打印 N 次,并且重复打印时 'createdAt' 列递增。最后将结果输出到 'training-data-prd-generated-by-python.csv' 文件。
import pandas as pd
# 读取原始文件
df = pd.read_csv('results-20230630t1147-processing.csv')
# 创建空的 DataFrame 用于存储结果
result = pd.DataFrame()
# 遍历每一行
for index, row in df.iterrows():
N = int(row[3]) # 获取第 4 列的数字数 N
repeated_rows = pd.DataFrame([row] * N) # 将当前行重复 N 次
repeated_rows['createdAt'] = pd.date_range(start=row['createdAt'], periods=N) # 递增 'createdAt' 列
result = result.append(repeated_rows) # 将重复的行添加到结果中
# 将结果输出到文件
result.to_csv('training-data-prd-generated-by-python.csv', index=False)
请确保在运行脚本之前已经安装了 Pandas 库。
原文地址: https://www.cveoy.top/t/topic/o6wW 著作权归作者所有。请勿转载和采集!