@resource_reference{'/dataset/ods/df_orders.csv'}

import os from datetime import datetime

if 'main' == name: # 定义输入和输出文件名 input_file_name = 'dataset/ods/df_orders.csv' output_file_name = '${bdp.system.savingModelPath}' + 'df_orders_1g.csv'

# 打开输出文件并逐行复制输入文件内容
with open(output_file_name, 'w') as output_file:
    with open(input_file_name, 'r') as input_file:
        line = input_file.readline()
        output_file.writelines(line)
        line = input_file.readline()
        k = 0
        while line:
            k += 1
            output_file.writelines(line)
            # output_file.writelines(line)
            line = input_file.readline()
            if 0 == k % 100000:
                print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'), k, line, flush=True)
        print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'), k, line, flush=True)

# 输出文件大小
print(os.path.getsize(input_file_name)/1024/1024, 'M')
print(os.path.getsize(output_file_name)/1024/1024, 'M')

Python CSV 文件复制工具 - 每 10 万行输出进度

@resource_reference{'/dataset/ods/df_orders.csv'}