读取文件

df = pd.read_csv("results-20230630t1147-processing.csv")

新建空DataFrame

new_df = pd.DataFrame(columns=df.columns)

遍历每一行

for index, row in df.iterrows(): # 获取重复次数 repeat_times = int(row[3])

# 重复打印
for i in range(repeat_times):
    new_row = row.copy()
    
    # 更新createdAt列
    new_row[2] += i
    
    # 添加到新的DataFrame中
    new_df = new_df.append(new_row, ignore_index=True)

输出到文件

new_df.to_csv("training-data-prd-process-by-python.csv", index=False

写一个python脚本使用pandas库读取results-20230630t1147-processingcsv文件将文件中的每行按该行第4列的数字数N重复打印N次源文件中createdAt列为UNIX时间戳格式重复打印时createdAt列递增。最后输出到training-data-prd-process-by-pythoncsv

原文地址: http://www.cveoy.top/t/topic/hDQU 著作权归作者所有。请勿转载和采集!