Python Openpyxl 拆分 Excel 表格:按第一列分组并生成新工作表
import openpyxl
import os
from datetime import datetime
from openpyxl import load_workbook
from openpyxl.styles import colors, Font, PatternFill, Alignment
from openpyxl.cell import Cell
# 打开Excel文件
wb = openpyxl.load_workbook(r'C:\Users\Administrator\Desktop\工作簿1.xlsx')
sheet = wb.worksheets[0] # 获取第一个工作表
sheet.freeze_panes = 'A2' # 冻结A1窗格
# 获取第二行所有单元格的内容
row2_values = []
for cell in sheet[2]:
row2_values.append(cell.value)
# 获取第一列所有单元格的内容
col1_values = [cell.value for cell in sheet['A']]
# 排除A1单元格
col1_values = col1_values[1:]
# 拆分第一列单元格内容到新的工作表
unique_values = set(col1_values)
for value in unique_values:
count = col1_values.count(value)
new_sheet_name = f"{value} ({count} 人)"
new_sheet = wb.create_sheet(title=new_sheet_name)
# 在新工作表的第一行插入原工作表A1单元格的内容
new_sheet.insert_rows(1)
for col_num, cell in enumerate(sheet[1], 1):
new_sheet.cell(row=1, column=col_num, value=cell.value)
# 添加第二行单元格内容到新工作表
new_sheet.append(row2_values)
# 添加第一列单元格内容到新工作表
for row_num, cell_value in enumerate(col1_values):
if cell_value == value:
row = [cell.value for cell in sheet[row_num + 2]]
new_row = []
for cell in row:
if isinstance(cell.value, str):
new_cell = Cell(new_sheet, column=cell.column, row=cell.row, value="")
else:
new_cell = Cell(new_sheet, column=cell.column, row=cell.row, value=cell.value)
new_cell.font = cell.font
new_cell.fill = cell.fill
new_row.append(new_cell)
new_sheet.append(new_row)
# 删除新工作表中的空行
for row in new_sheet.iter_rows():
if all([cell.value is None for cell in row]):
new_sheet.delete_rows(row[0].row)
# 合并第一行单元格并居中
num_cols = new_sheet.max_column
new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=num_cols)
new_sheet.cell(row=1, column=1).alignment = Alignment(horizontal='center', vertical='center')
# 删除工作表名字为表头(1)人的工作表
if '表头 (1 人)' in wb.sheetnames:
wb.remove(wb['表头 (1 人)'])
# 保存为新的excel文件
wb.save(r'C:\Users\Administrator\Desktop\拆分表格结果.xlsx')
代码解释:
- 导入必要的库:
openpyxl用于操作 Excel 文件,os用于文件路径操作,datetime用于日期时间处理,colors,Font,PatternFill,Alignment用于设置单元格样式。 - 打开 Excel 文件:
load_workbook()函数打开指定的 Excel 文件。 - 获取第一个工作表:
worksheets[0]获取工作簿中的第一个工作表。 - 冻结窗格:
freeze_panes属性将 A1 窗格冻结。 - 获取第二行数据:遍历第二行的所有单元格,将每个单元格的值添加到列表
row2_values中。 - 获取第一列数据:使用列表推导获取第一列所有单元格的值,并去除 A1 单元格的值。
- 拆分数据并创建新工作表:遍历第一列所有唯一的值,创建新的工作表,并根据值将数据添加到对应的工作表中。
- 添加数据到新工作表:
- 将原工作表的 A1 单元格内容添加到新工作表的首行。
- 将第二行数据添加到新工作表的第二行。
- 将第一列数据中对应值的其它行数据添加到新工作表中。
- 删除空行:遍历新工作表的所有行,如果整行都是空值,则删除该行。
- 合并第一行单元格:合并第一行所有单元格,并设置水平和垂直居中。
- 删除指定的表头工作表:
remove()函数删除名为 '表头 (1 人)' 的工作表。 - 保存文件:
save()函数将修改后的 Excel 文件保存到指定路径。
代码修改:
代码中对单元格的 value 属性进行了判断,如果单元格的值是字符串类型,则赋值为空字符串,否则将原来的值赋值给新单元格。这样避免了字符串类型单元格报错,并保留了单元格的格式和样式。
注意事项:
- 代码中的文件路径需要根据实际情况进行修改。
- 如果 Excel 文件中存在特殊字符,可能会出现问题,建议先将文件中的特殊字符进行处理。
- 该代码只适用于单个 Excel 文件的拆分,如果需要处理多个文件,可以将代码封装成函数,并使用循环遍历文件列表。
- 为了提高代码的可读性和维护性,建议使用更具描述性的变量名和注释。
相关资源:
- Openpyxl 文档:https://openpyxl.readthedocs.io/
- Python 学习资料:https://www.python.org/
原文地址: https://www.cveoy.top/t/topic/laCX 著作权归作者所有。请勿转载和采集!