import os
import openpyxl
import threading
import platform

def split_excel_file(file_path):
    # 打开Excel文件
    wb = openpyxl.load_workbook(file_path)
    sheet = wb.worksheets[0] # 获取第一个工作表

    # 获取第二行所有单元格的内容
    row2_values = [cell.value for cell in sheet[2]]

    # 获取第一列所有单元格的内容
    col1_values = [cell.value for cell in sheet['A']]
    # 排除A1单元格
    col1_values = col1_values[1:]

    # 拆分第一列单元格内容到新的工作表
    unique_values = set(col1_values)

    # 创建线程列表
    threads = []

    for value in unique_values:
        count = col1_values.count(value)
        new_sheet_name = f'{value} ({count} 人)'
        new_sheet = wb.create_sheet(title=new_sheet_name)

        # 在新工作表的第一行插入原工作表A1单元格的内容
        new_sheet.insert_rows(1)
        for col_num, cell in enumerate(sheet[1], 1):
            new_sheet.cell(row=1, column=col_num, value=cell.value)

        # 添加第二行单元格内容到新工作表
        new_sheet.append(row2_values)

        # 添加第一列单元格内容到新工作表
        rows = []
        for row_num, cell_value in enumerate(col1_values):
            if cell_value == value:
                rows.append([cell.value for cell in sheet[row_num + 2]])

        # 创建线程
        t = threading.Thread(target=append_rows, args=(new_sheet, rows))
        threads.append(t)

        # 合并第一行单元格并居中
        num_cols = new_sheet.max_column
        new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
        new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center')

    # 启动所有线程
    for t in threads:
        t.start()

    # 等待所有线程结束
    for t in threads:
        t.join()

    # 删除工作表名字为表头(1)人的工作表
    if '表头 (1 人)' in wb.sheetnames:
        wb.remove(wb['表头 (1 人)'])

    # 删除新工作表中的空行
    for sheet in wb.worksheets:
        rows = sheet.max_row
        cols = sheet.max_column
        for row in range(rows, 0, -1):
            empty = True
            for col in range(1, cols+1):
                if sheet.cell(row=row, column=col).value is not None:
                    empty = False
                    break
            if empty:
                sheet.delete_rows(row)

    # 保存为新的excel文件
    new_file_path = os.path.splitext(file_path)[0] + '_拆分结果.xlsx'
    wb.save(new_file_path)

    # 获取所有工作表
    sheets = wb.sheetnames
    # 排除第一个工作表
    sheets = sheets[1:]

    # 创建拆分结果文件夹
    if platform.system() == 'Windows':
        desktop_path = os.path.join(os.path.expanduser('~'), 'Desktop')
    else:
        desktop_path = os.path.join(os.path.expanduser('~'), '桌面')
    folder_name = '拆分结果'
    folder_path = os.path.join(desktop_path, folder_name)
    if not os.path.exists(folder_path):
        os.mkdir(folder_path)

    # 遍历每个工作表
    for sheet_name in sheets:
        # 创建新的Excel文件
        new_wb = openpyxl.Workbook()
        new_sheet = new_wb.active

        # 复制工作表内容到新的Excel文件
        sheet = wb[sheet_name]
        for row in sheet.iter_rows():
            for cell in row:
                new_sheet[cell.coordinate].value = cell.value

        # 保存新的Excel文件
        file_name = f'{sheet_name}.xlsx'
        file_path = os.path.join(folder_path, file_name)
        new_wb.save(file_path)

        # 关闭新的Excel文件
        new_wb.close()

    # 关闭原Excel文件
    wb.close()

def append_rows(sheet, rows):
    for row in rows:
        sheet.append(row)

if __name__ == '__main__':
    file_path = input('请输入需要拆分的Excel文件路径:')
    split_excel_file(file_path)
    print('拆分完成!!')

本 Python 脚本使用 openpyxl 库,根据 Excel 文件第一列的唯一值,将文件拆分成多个独立的 Excel 文件,并利用多线程加速处理过程。用户只需输入需要拆分的 Excel 文件路径,即可自动完成拆分操作,并将拆分后的文件存放在桌面“拆分结果”文件夹中。

使用说明:

  1. 确保系统已安装 openpyxl 库,可以使用 pip install openpyxl 进行安装。
  2. 将代码保存为 Python 文件(例如 split_excel.py)。
  3. 运行 Python 文件,输入需要拆分的 Excel 文件路径,程序会自动完成拆分操作。

代码功能:

  1. 读取 Excel 文件,获取第一列的唯一值。
  2. 根据每个唯一值创建新的工作表,并复制对应行的所有数据。
  3. 使用多线程处理,加速拆分速度。
  4. 删除新工作表中的空行。
  5. 将拆分后的工作表保存到新的 Excel 文件,并放置在桌面“拆分结果”文件夹中。

代码优势:

  1. 代码简洁高效,易于理解和使用。
  2. 使用多线程技术,提升了拆分效率。
  3. 自动化拆分过程,简化用户操作。

注意事项:

  1. 本代码假设 Excel 文件的第一列包含需要拆分的唯一值。
  2. 代码会将拆分后的文件保存到桌面“拆分结果”文件夹中,请确保路径正确。
  3. 如果需要拆分其他列,可以修改代码中的 col1_valuessheet['A'] 部分。

本脚本可以有效地帮助用户快速将大型 Excel 文件拆分成多个独立的文件,方便数据分析和处理。

Python Excel 拆分工具:根据第一列内容将Excel文件拆分成多个文件

原文地址: https://www.cveoy.top/t/topic/ozD2 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录