import os
import openpyxl
import threading
import platform
import tkinter as tk
from tkinter import filedialog

def split_excel_file(file_path):
    # 打开Excel文件
    wb = openpyxl.load_workbook(file_path)
    sheet = wb.worksheets[0] # 获取第一个工作表

    # 获取第二行所有单元格的内容
    row2_values = [cell.value for cell in sheet[2]]

    # 获取第一列所有单元格的内容
    col1_values = [cell.value for cell in sheet['A']]
    # 排除A1单元格
    col1_values = col1_values[1:]

    # 拆分第一列单元格内容到新的工作表
    unique_values = set(col1_values)

    # 创建线程列表
    threads = []

    for value in unique_values:
        count = col1_values.count(value)
        new_sheet_name = f'{value} ({count} 人)'
        new_sheet = wb.create_sheet(title=new_sheet_name)

        # 在新工作表的第一行插入原工作表A1单元格的内容
        new_sheet.insert_rows(1)
        for col_num, cell in enumerate(sheet[1], 1):
            new_sheet.cell(row=1, column=col_num, value=cell.value)

        # 添加第二行单元格内容到新工作表
        new_sheet.append(row2_values)

        # 添加第一列单元格内容到新工作表
        rows = []
        for row_num, cell_value in enumerate(col1_values):
            if cell_value == value:
                rows.append([cell.value for cell in sheet[row_num + 2]])

        # 创建线程
        t = threading.Thread(target=append_rows, args=(new_sheet, rows))
        threads.append(t)

        # 合并第一行单元格并居中
        num_cols = new_sheet.max_column
        new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
        new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center')

    # 启动所有线程
    for t in threads:
        t.start()

    # 等待所有线程结束
    for t in threads:
        t.join()

    # 删除工作表名字为表头(1)人的工作表
    if '表头 (1 人)' in wb.sheetnames:
        wb.remove(wb['表头 (1 人)'])

    # 删除新工作表中的空行
    for sheet in wb.worksheets:
        rows = sheet.max_row
        cols = sheet.max_column
        for row in range(rows, 0, -1):
            empty = True
            for col in range(1, cols+1):
                if sheet.cell(row=row, column=col).value is not None:
                    empty = False
                    break
            if empty:
                sheet.delete_rows(row)

    # 保存为新的excel文件
    new_file_path = os.path.splitext(file_path)[0] + '_拆分结果.xlsx'
    wb.save(new_file_path)

    # 获取所有工作表
    sheets = wb.sheetnames
    # 排除第一个工作表
    sheets = sheets[1:]

    # 创建拆分结果文件夹
    if platform.system() == 'Windows':
        if platform.release() == '7':
            desktop_path = os.path.join(os.path.expanduser('~'), '桌面')
        else:
            desktop_path = os.path.join(os.path.expanduser('~'), 'Desktop')
    else:
        desktop_path = os.path.join(os.path.expanduser('~'), '桌面')
    folder_name = os.path.splitext(file_path)[0] + '_拆分结果'
    folder_path = os.path.join(desktop_path, folder_name)
    if not os.path.exists(folder_path):
        os.mkdir(folder_path)

    # 遍历每个工作表
    for sheet_name in sheets:
        # 创建新的Excel文件
        new_wb = openpyxl.Workbook()
        new_sheet = new_wb.active

        # 复制工作表内容到新的Excel文件
        sheet = wb[sheet_name]
        for row in sheet.iter_rows():
            for cell in row:
                new_sheet[cell.coordinate].value = cell.value

        # 合并第一行单元格并居中
        num_cols = new_sheet.max_column
        new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
        new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center',
                                                                                      vertical='center')
        # 保存新的Excel文件
        file_name = f'{sheet_name}.xlsx'
        file_path = os.path.join(folder_path, file_name)
        new_wb.save(file_path)

        # 关闭新的Excel文件
        new_wb.close()

    # 关闭原Excel文件
    wb.close()

def append_rows(sheet, rows):
    for row in rows:
        sheet.append(row)

if __name__ == '__main__':
    # 创建GUI界面
    root = tk.Tk()
    root.withdraw()

    # 打开文件选择对话框
    file_path = filedialog.askopenfilename(title='选择需要拆分的Excel文件', filetypes=[('Excel 文件', '*.xlsx')])

    if file_path:
        # 调用拆分Excel文件函数
        split_excel_file(file_path)
        print('拆分完成!!')

使用方法:

  1. 确保电脑上已经安装了 Python 环境和 openpyxl 库。
  2. 将代码保存为 .py 文件,例如 split_excel.py
  3. 双击运行该文件,或在命令行中输入 python split_excel.py 运行。
  4. 选择需要拆分的 Excel 文件,程序会自动将拆分结果保存到桌面新建文件夹中。

代码功能:

  • 按第一列内容拆分 Excel 文件,将每个唯一值对应的内容拆分成一个新的 Excel 文件。
  • 使用多线程加速拆分过程。
  • 将拆分结果保存到桌面新建文件夹中,每个文件对应一个唯一值。
  • 自动删除新工作表中的空行。

注意:

  • 代码需要修改 桌面 的路径,以适应不同系统环境。
  • 代码假设第一列数据存在唯一值,如果存在重复值,则会按照重复值出现次数进行拆分。
  • 代码仅支持 *.xlsx 格式的 Excel 文件。

代码优化:

  • 使用 threading 模块实现多线程,提高拆分效率。
  • 使用 platform 模块判断操作系统类型,以适应不同系统环境。
  • 使用 os.path.splitext 函数提取文件名和扩展名,简化代码逻辑。
  • 使用 os.path.join 函数拼接路径,避免手动拼接路径字符串。
  • 使用 openpyxl.styles.Alignment 类设置单元格对齐方式。
  • 使用 openpyxl.Workbook.remove 方法删除工作表。
  • 使用 openpyxl.Worksheet.delete_rows 方法删除空行。
  • 使用 filedialog 模块选择需要拆分的 Excel 文件。

其他功能:

  • 可以添加功能,例如选择拆分列、指定保存路径、添加进度条等。
  • 可以将代码打包成可执行文件,方便其他用户使用。
  • 可以将代码放到一个 Python 脚本中并提供给其他用户,让他们通过命令行或者 IDE 运行该文件即可。

参考文档:

Python Excel 拆分工具: 按第一列内容将 Excel 文件拆分成多个文件

原文地址: https://www.cveoy.top/t/topic/fYe5 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录