Python Openpyxl 库拆分 Excel 表格教程:按第一列内容分类并导出
使用 Python Openpyxl 库拆分 Excel 表格
本教程将演示如何使用 Python 3.8 版本的 openpyxl 库拆分 Excel 表格,并按第一列内容分类,并将每个工作表导出为单独的 Excel 文件。
代码示例
import openpyxl
from datetime import datetime
# 打开 Excel 文件
wb = openpyxl.load_workbook(r'C:\Users\Administrator\Desktop\工作簿1.xlsx')
# 获取第一个工作表
sheet = wb.worksheets[0]
# 冻结 A1 窗格
sheet.freeze_panes = 'A2'
# 获取第二行所有单元格的内容
row2_values = []
for cell in sheet[2]:
row2_values.append(cell.value)
print(row2_values)
# 获取第一列所有单元格的内容
col1_values = [cell.value for cell in sheet['A']]
col1_values = col1_values[1:] # 排除 A1 单元格
# 拆分第一列单元格内容到新的工作表
unique_values = set(col1_values)
for value in unique_values:
count = col1_values.count(value)
new_sheet_name = f'{value} ({count} 人)'
new_sheet = wb.create_sheet(title=new_sheet_name)
# 在新工作表的第一行插入原工作表 A1 单元格的内容
new_sheet.insert_rows(1)
for col_num, cell in enumerate(sheet[1], 1):
new_sheet.cell(row=1, column=col_num, value=cell.value)
# 添加第二行单元格内容到新工作表
new_sheet.append(row2_values)
# 添加第一列单元格内容到新工作表
for row_num, cell_value in enumerate(col1_values):
if cell_value == value:
new_sheet.append([cell.value for cell in sheet[row_num + 2]])
# 删除新工作表中的空行
for row in new_sheet.iter_rows():
if all([cell.value is None for cell in row]):
new_sheet.delete_rows(row[0].row)
# 导出新工作表为单独的 Excel 文件
file_name = f'{new_sheet_name}-{datetime.now().strftime('%Y%m%d')}.xlsx'
new_wb = openpyxl.Workbook()
new_wb.remove(new_wb.active)
new_wb.add_sheet(new_sheet)
new_wb.save(file_name)
# 删除工作表名字为表头(1)人的工作表
if '表头 (1 人)' in wb.sheetnames:
wb.remove(wb['表头 (1 人)'])
代码说明
- 导入必要的库
openpyxl用于操作 Excel 文件datetime用于获取当前日期
- 打开 Excel 文件
- 使用
openpyxl.load_workbook()函数打开指定路径的 Excel 文件
- 使用
- 获取第一个工作表
- 使用
wb.worksheets[0]获取第一个工作表
- 使用
- 冻结 A1 窗格
- 使用
sheet.freeze_panes = 'A2'冻结 A1 窗格,使第一行和第一列始终可见
- 使用
- 获取第二行所有单元格的内容
- 使用循环遍历第二行所有单元格,并将其值添加到
row2_values列表中
- 使用循环遍历第二行所有单元格,并将其值添加到
- 获取第一列所有单元格的内容
- 使用列表推导获取第一列所有单元格的值,并将第一个单元格(A1)的值排除
- 拆分第一列单元格内容到新的工作表
- 使用
set()获取第一列所有唯一值 - 遍历所有唯一值,并根据每个值创建新的工作表,命名规则为“值 (重复次数) 人”。
- 将第一行(原工作表 A1 单元格)内容复制到新工作表的第一行
- 将第二行内容复制到新工作表
- 将第一列中所有与当前值相同的行内容复制到新工作表
- 删除新工作表中的空行
- 将新工作表导出为单独的 Excel 文件,文件名为“工作表名称-当前日期.xlsx”。
- 使用
- 删除工作表名字为“表头 (1 人)”的工作表
- 使用
if '表头 (1 人)' in wb.sheetnames判断工作表是否存在,如果存在则使用wb.remove(wb['表头 (1 人)'])删除该工作表。
- 使用
代码运行结果
运行代码后,将根据第一列内容拆分出多个新的 Excel 文件,每个文件包含相应内容的所有行,并保留原工作表的第二行和第一行 A1 单元格内容。
总结
本教程演示了如何使用 Python 的 openpyxl 库拆分 Excel 表格,并根据第一列内容分类,并将每个工作表导出为单独的 Excel 文件。该方法可以帮助您快速高效地处理大型 Excel 表格,并方便数据分析和处理。
注意:
- 请将代码中的
r'C:\Users\Administrator\Desktop\工作簿1.xlsx'替换为您的实际 Excel 文件路径 - 您可以根据需要修改代码中的工作表名和导出文件名的格式
- 如果遇到任何问题,请在评论区留言
原文地址: https://www.cveoy.top/t/topic/fXb0 著作权归作者所有。请勿转载和采集!