Python 使用 Openpyxl 拆分 Excel 文件并删除空行
import os
from datetime import datetime
import openpyxl
import threading
# 定义拆分 Excel 文件函数
def split_excel_file(file_path):
# 打开 Excel 文件
wb = openpyxl.load_workbook(file_path)
sheet = wb.worksheets[0] # 获取第一个工作表
# 获取第二行所有单元格的内容
row2_values = [cell.value for cell in sheet[2]]
# 获取第一列所有单元格的内容
col1_values = [cell.value for cell in sheet['A']]
# 排除 A1 单元格
col1_values = col1_values[1:]
# 拆分第一列单元格内容到新的工作表
unique_values = set(col1_values)
# 创建线程列表
threads = []
for value in unique_values:
count = col1_values.count(value)
new_sheet_name = f'{value} ({count} 人)'
new_sheet = wb.create_sheet(title=new_sheet_name)
# 在新工作表的第一行插入原工作表 A1 单元格的内容
new_sheet.insert_rows(1)
for col_num, cell in enumerate(sheet[1], 1):
new_sheet.cell(row=1, column=col_num, value=cell.value)
# 添加第二行单元格内容到新工作表
new_sheet.append(row2_values)
# 添加第一列单元格内容到新工作表
rows = []
for row_num, cell_value in enumerate(col1_values):
if cell_value == value:
rows.append([cell.value for cell in sheet[row_num + 2]])
# 创建线程
t = threading.Thread(target=append_rows, args=(new_sheet, rows))
threads.append(t)
# 合并第一行单元格并居中
num_cols = new_sheet.max_column
new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center')
# 启动所有线程
for t in threads:
t.start()
# 等待所有线程结束
for t in threads:
t.join()
# 删除工作表名字为表头(1)人的工作表
if '表头 (1 人)' in wb.sheetnames:
wb.remove(wb['表头 (1 人)'])
# 删除新工作表中的空行
for sheet in wb.worksheets:
rows = sheet.max_row
cols = sheet.max_column
for row in range(rows, 0, -1):
empty = True
for col in range(1, cols + 1):
if sheet.cell(row=row, column=col).value is not None:
empty = False
break
if empty:
sheet.delete_rows(row)
# 保存为新的 excel 文件
new_file_path = os.path.splitext(file_path)[0] + '_拆分结果.xlsx'
wb.save(new_file_path)
# 获取所有工作表
sheets = wb.sheetnames
# 排除第一个工作表
sheets = sheets[1:]
# 创建拆分结果文件夹
folder_name = '拆分结果'
desktop_path = os.path.join(os.path.expanduser('~'), 'Desktop')
folder_path = os.path.join(desktop_path, folder_name)
if not os.path.exists(folder_path):
os.mkdir(folder_path)
# 遍历每个工作表
for sheet_name in sheets:
# 创建新的 Excel 文件
new_wb = openpyxl.Workbook()
new_sheet = new_wb.active
# 复制工作表内容到新的 Excel 文件
sheet = wb[sheet_name]
for row in sheet.iter_rows():
for cell in row:
new_sheet[cell.coordinate].value = cell.value
# 保存新的 Excel 文件
date_str = datetime.now().strftime('%Y-%m-%d')
file_name = f'{sheet_name}-{date_str}.xlsx'
file_path = os.path.join(folder_path, file_name)
new_wb.save(file_path)
# 关闭新的 Excel 文件
new_wb.close()
# 关闭原 Excel 文件
wb.close()
def append_rows(sheet, rows):
for row in rows:
sheet.append(row)
if __name__ == '__main__':
file_path = r'C:\Users\Administrator\Desktop\工作簿1.xlsx'
split_excel_file(file_path)
print('拆分完成!!')
功能说明:
- 使用
openpyxl库打开 Excel 文件并获取第一个工作表。 - 获取第二行所有单元格的内容和第一列所有单元格的内容(排除 A1 单元格)。
- 使用
set获取第一列单元格内容的唯一值。 - 循环遍历每个唯一值,创建新的工作表,并命名为
值(数量 人)。 - 将原始工作表的 A1 单元格内容复制到新工作表的首行,添加第二行内容,以及将第一列内容与唯一值匹配的对应行内容添加到新工作表。
- 使用多线程并行处理每个唯一值的工作表,提高效率。
- 合并新工作表的第一行单元格并居中。
- 删除工作表名字为
表头 (1 人)的工作表。 - 删除每个新工作表中的空行:
- 获取工作表最大行数和最大列数。
- 从最后一行开始遍历,检查每一行是否为空行。
- 如果为空行,则使用
sheet.delete_rows(row)删除该行。
- 将拆分后的 Excel 文件保存到新的路径。
- 遍历每个工作表,创建一个新的 Excel 文件,并复制工作表内容到新的 Excel 文件。
- 将每个新 Excel 文件保存到桌面上的
拆分结果文件夹中。
注意:
file_path变量应改为你的 Excel 文件路径。- 你可能需要安装
openpyxl库:pip install openpyxl。 - 由于使用了多线程,你需要确保你的 Excel 文件不会被其他程序修改。
- 你可以根据需要调整代码中的相关变量和参数。
原文地址: https://www.cveoy.top/t/topic/fXrI 著作权归作者所有。请勿转载和采集!