Python Excel 拆分工具: 按第一列内容将 Excel 文件拆分成多个文件
import os
import openpyxl
import threading
import platform
import tkinter as tk
from tkinter import filedialog
def split_excel_file(file_path):
# 打开Excel文件
wb = openpyxl.load_workbook(file_path)
sheet = wb.worksheets[0] # 获取第一个工作表
# 获取第二行所有单元格的内容
row2_values = [cell.value for cell in sheet[2]]
# 获取第一列所有单元格的内容
col1_values = [cell.value for cell in sheet['A']]
# 排除A1单元格
col1_values = col1_values[1:]
# 拆分第一列单元格内容到新的工作表
unique_values = set(col1_values)
# 创建线程列表
threads = []
for value in unique_values:
count = col1_values.count(value)
new_sheet_name = f'{value} ({count} 人)'
new_sheet = wb.create_sheet(title=new_sheet_name)
# 在新工作表的第一行插入原工作表A1单元格的内容
new_sheet.insert_rows(1)
for col_num, cell in enumerate(sheet[1], 1):
new_sheet.cell(row=1, column=col_num, value=cell.value)
# 添加第二行单元格内容到新工作表
new_sheet.append(row2_values)
# 添加第一列单元格内容到新工作表
rows = []
for row_num, cell_value in enumerate(col1_values):
if cell_value == value:
rows.append([cell.value for cell in sheet[row_num + 2]])
# 创建线程
t = threading.Thread(target=append_rows, args=(new_sheet, rows))
threads.append(t)
# 合并第一行单元格并居中
num_cols = new_sheet.max_column
new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center')
# 启动所有线程
for t in threads:
t.start()
# 等待所有线程结束
for t in threads:
t.join()
# 删除工作表名字为表头(1)人的工作表
if '表头 (1 人)' in wb.sheetnames:
wb.remove(wb['表头 (1 人)'])
# 删除新工作表中的空行
for sheet in wb.worksheets:
rows = sheet.max_row
cols = sheet.max_column
for row in range(rows, 0, -1):
empty = True
for col in range(1, cols+1):
if sheet.cell(row=row, column=col).value is not None:
empty = False
break
if empty:
sheet.delete_rows(row)
# 保存为新的excel文件
new_file_path = os.path.splitext(file_path)[0] + '_拆分结果.xlsx'
wb.save(new_file_path)
# 获取所有工作表
sheets = wb.sheetnames
# 排除第一个工作表
sheets = sheets[1:]
# 创建拆分结果文件夹
if platform.system() == 'Windows':
if platform.release() == '7':
desktop_path = os.path.join(os.path.expanduser('~'), '桌面')
else:
desktop_path = os.path.join(os.path.expanduser('~'), 'Desktop')
else:
desktop_path = os.path.join(os.path.expanduser('~'), '桌面')
folder_name = os.path.splitext(file_path)[0] + '_拆分结果'
folder_path = os.path.join(desktop_path, folder_name)
if not os.path.exists(folder_path):
os.mkdir(folder_path)
# 遍历每个工作表
for sheet_name in sheets:
# 创建新的Excel文件
new_wb = openpyxl.Workbook()
new_sheet = new_wb.active
# 复制工作表内容到新的Excel文件
sheet = wb[sheet_name]
for row in sheet.iter_rows():
for cell in row:
new_sheet[cell.coordinate].value = cell.value
# 合并第一行单元格并居中
num_cols = new_sheet.max_column
new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center',
vertical='center')
# 保存新的Excel文件
file_name = f'{sheet_name}.xlsx'
file_path = os.path.join(folder_path, file_name)
new_wb.save(file_path)
# 关闭新的Excel文件
new_wb.close()
# 关闭原Excel文件
wb.close()
def append_rows(sheet, rows):
for row in rows:
sheet.append(row)
if __name__ == '__main__':
# 创建GUI界面
root = tk.Tk()
root.withdraw()
# 打开文件选择对话框
file_path = filedialog.askopenfilename(title='选择需要拆分的Excel文件', filetypes=[('Excel 文件', '*.xlsx')])
if file_path:
# 调用拆分Excel文件函数
split_excel_file(file_path)
print('拆分完成!!')
使用方法:
- 确保电脑上已经安装了 Python 环境和
openpyxl库。 - 将代码保存为
.py文件,例如split_excel.py。 - 双击运行该文件,或在命令行中输入
python split_excel.py运行。 - 选择需要拆分的 Excel 文件,程序会自动将拆分结果保存到桌面新建文件夹中。
代码功能:
- 按第一列内容拆分 Excel 文件,将每个唯一值对应的内容拆分成一个新的 Excel 文件。
- 使用多线程加速拆分过程。
- 将拆分结果保存到桌面新建文件夹中,每个文件对应一个唯一值。
- 自动删除新工作表中的空行。
注意:
- 代码需要修改
桌面的路径,以适应不同系统环境。 - 代码假设第一列数据存在唯一值,如果存在重复值,则会按照重复值出现次数进行拆分。
- 代码仅支持
*.xlsx格式的 Excel 文件。
代码优化:
- 使用
threading模块实现多线程,提高拆分效率。 - 使用
platform模块判断操作系统类型,以适应不同系统环境。 - 使用
os.path.splitext函数提取文件名和扩展名,简化代码逻辑。 - 使用
os.path.join函数拼接路径,避免手动拼接路径字符串。 - 使用
openpyxl.styles.Alignment类设置单元格对齐方式。 - 使用
openpyxl.Workbook.remove方法删除工作表。 - 使用
openpyxl.Worksheet.delete_rows方法删除空行。 - 使用
filedialog模块选择需要拆分的 Excel 文件。
其他功能:
- 可以添加功能,例如选择拆分列、指定保存路径、添加进度条等。
- 可以将代码打包成可执行文件,方便其他用户使用。
- 可以将代码放到一个 Python 脚本中并提供给其他用户,让他们通过命令行或者 IDE 运行该文件即可。
参考文档:
原文地址: https://www.cveoy.top/t/topic/fYe5 著作权归作者所有。请勿转载和采集!