import os
from datetime import datetime
import openpyxl
import threading

# 定义拆分 Excel 文件函数
def split_excel_file(file_path):
    # 打开 Excel 文件
    wb = openpyxl.load_workbook(file_path)
    sheet = wb.worksheets[0]  # 获取第一个工作表

    # 获取第二行所有单元格的内容
    row2_values = [cell.value for cell in sheet[2]]

    # 获取第一列所有单元格的内容
    col1_values = [cell.value for cell in sheet['A']]
    # 排除 A1 单元格
    col1_values = col1_values[1:]

    # 拆分第一列单元格内容到新的工作表
    unique_values = set(col1_values)

    # 创建线程列表
    threads = []

    for value in unique_values:
        count = col1_values.count(value)
        new_sheet_name = f'{value} ({count} 人)'
        new_sheet = wb.create_sheet(title=new_sheet_name)

        # 在新工作表的第一行插入原工作表 A1 单元格的内容
        new_sheet.insert_rows(1)
        for col_num, cell in enumerate(sheet[1], 1):
            new_sheet.cell(row=1, column=col_num, value=cell.value)

        # 添加第二行单元格内容到新工作表
        new_sheet.append(row2_values)

        # 添加第一列单元格内容到新工作表
        rows = []
        for row_num, cell_value in enumerate(col1_values):
            if cell_value == value:
                rows.append([cell.value for cell in sheet[row_num + 2]])

        # 创建线程
        t = threading.Thread(target=append_rows, args=(new_sheet, rows))
        threads.append(t)

        # 合并第一行单元格并居中
        num_cols = new_sheet.max_column
        new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
        new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center')

    # 启动所有线程
    for t in threads:
        t.start()

    # 等待所有线程结束
    for t in threads:
        t.join()

    # 删除工作表名字为表头(1)人的工作表
    if '表头 (1 人)' in wb.sheetnames:
        wb.remove(wb['表头 (1 人)'])

    # 删除新工作表中的空行
    for sheet in wb.worksheets:
        rows = sheet.max_row
        cols = sheet.max_column
        for row in range(rows, 0, -1):
            empty = True
            for col in range(1, cols + 1):
                if sheet.cell(row=row, column=col).value is not None:
                    empty = False
                    break
            if empty:
                sheet.delete_rows(row)

    # 保存为新的 excel 文件
    new_file_path = os.path.splitext(file_path)[0] + '_拆分结果.xlsx'
    wb.save(new_file_path)

    # 获取所有工作表
    sheets = wb.sheetnames
    # 排除第一个工作表
    sheets = sheets[1:]

    # 创建拆分结果文件夹
    folder_name = '拆分结果'
    desktop_path = os.path.join(os.path.expanduser('~'), 'Desktop')
    folder_path = os.path.join(desktop_path, folder_name)
    if not os.path.exists(folder_path):
        os.mkdir(folder_path)

    # 遍历每个工作表
    for sheet_name in sheets:
        # 创建新的 Excel 文件
        new_wb = openpyxl.Workbook()
        new_sheet = new_wb.active

        # 复制工作表内容到新的 Excel 文件
        sheet = wb[sheet_name]
        for row in sheet.iter_rows():
            for cell in row:
                new_sheet[cell.coordinate].value = cell.value

        # 保存新的 Excel 文件
        date_str = datetime.now().strftime('%Y-%m-%d')
        file_name = f'{sheet_name}-{date_str}.xlsx'
        file_path = os.path.join(folder_path, file_name)
        new_wb.save(file_path)

        # 关闭新的 Excel 文件
        new_wb.close()

    # 关闭原 Excel 文件
    wb.close()


def append_rows(sheet, rows):
    for row in rows:
        sheet.append(row)


if __name__ == '__main__':
    file_path = r'C:\Users\Administrator\Desktop\工作簿1.xlsx'
    split_excel_file(file_path)
    print('拆分完成!!')

功能说明:

  1. 使用 openpyxl 库打开 Excel 文件并获取第一个工作表。
  2. 获取第二行所有单元格的内容和第一列所有单元格的内容(排除 A1 单元格)。
  3. 使用 set 获取第一列单元格内容的唯一值。
  4. 循环遍历每个唯一值,创建新的工作表,并命名为 值(数量 人)
  5. 将原始工作表的 A1 单元格内容复制到新工作表的首行,添加第二行内容,以及将第一列内容与唯一值匹配的对应行内容添加到新工作表。
  6. 使用多线程并行处理每个唯一值的工作表,提高效率。
  7. 合并新工作表的第一行单元格并居中。
  8. 删除工作表名字为 表头 (1 人) 的工作表。
  9. 删除每个新工作表中的空行:
    • 获取工作表最大行数和最大列数。
    • 从最后一行开始遍历,检查每一行是否为空行。
    • 如果为空行,则使用 sheet.delete_rows(row) 删除该行。
  10. 将拆分后的 Excel 文件保存到新的路径。
  11. 遍历每个工作表,创建一个新的 Excel 文件,并复制工作表内容到新的 Excel 文件。
  12. 将每个新 Excel 文件保存到桌面上的 拆分结果 文件夹中。

注意:

  • file_path 变量应改为你的 Excel 文件路径。
  • 你可能需要安装 openpyxl 库:pip install openpyxl
  • 由于使用了多线程,你需要确保你的 Excel 文件不会被其他程序修改。
  • 你可以根据需要调整代码中的相关变量和参数。
Python 使用 Openpyxl 拆分 Excel 文件并删除空行

原文地址: https://www.cveoy.top/t/topic/fXrI 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录