Python脚本:使用Pandas库重复打印CSV数据并递增时间戳
你好!以下是使用pandas库编写的Python脚本,实现了你的要求:
import pandas as pd
# 读取csv文件
df = pd.read_csv('results-20230630t1147-processing.csv')
# 创建一个新的DataFrame用于存储结果
result_df = pd.DataFrame(columns=['createdAt', 'result'])
# 遍历原始DataFrame的每一行
for index, row in df.iterrows():
# 获取第4列的数字数N
n = int(row[3])
# 重复打印N次
for i in range(n):
# 计算递增的UNIX时间戳
timestamp = int(row[0]) + i
# 将结果添加到新的DataFrame中
result_df = result_df.append({'createdAt': timestamp, 'result': row[2]}, ignore_index=True)
# 将结果保存到csv文件
result_df.to_csv('training-data-prd-generated-by-python.csv', index=False)
请确保脚本文件与要处理的csv文件在同一目录下,并且已经安装了pandas库。运行脚本后,将生成一个名为'training-data-prd-generated-by-python.csv'的新csv文件,其中包含按要求重复打印的结果数据。
原文地址: https://www.cveoy.top/t/topic/o6zl 著作权归作者所有。请勿转载和采集!