使用Python Pandas 库将 CSV 文件中的日期转换为 Unix 时间戳并重复打印数据
以下是一个满足需求的 Python 脚本,使用了 pandas 库来读取和处理 CSV 文件:
import pandas as pd
import time
# 读取 CSV 文件
df = pd.read_csv('qat-training-data-middle.csv')
# 将 'createdAt' 列的日期格式替换为 UNIX 时间戳
df['createdAt'] = pd.to_datetime(df['createdAt']).apply(lambda x: int(time.mktime(x.timetuple())))
# 重复打印每行数据
output_rows = []
for index, row in df.iterrows():
n = int(row[3])
for _ in range(n):
output_rows.append(row)
# 创建新的 DataFrame 对象
output_df = pd.DataFrame(output_rows, columns=df.columns)
# 输出到 output.csv 文件
output_df.to_csv('output.csv', index=False)
请确保将脚本中的文件名替换为实际的文件路径和文件名。输出的数据将保存在名为 'output.csv' 的文件中。
原文地址: https://www.cveoy.top/t/topic/o6v1 著作权归作者所有。请勿转载和采集!