使用 Python Openpyxl 库拆分 Excel 表格

本教程将演示如何使用 Python 3.8 版本的 openpyxl 库拆分 Excel 表格,并按第一列内容分类,并将每个工作表导出为单独的 Excel 文件。

代码示例

import openpyxl
from datetime import datetime

# 打开 Excel 文件
wb = openpyxl.load_workbook(r'C:\Users\Administrator\Desktop\工作簿1.xlsx')

# 获取第一个工作表
sheet = wb.worksheets[0]

# 冻结 A1 窗格
sheet.freeze_panes = 'A2'

# 获取第二行所有单元格的内容
row2_values = []
for cell in sheet[2]:
    row2_values.append(cell.value)
print(row2_values)

# 获取第一列所有单元格的内容
col1_values = [cell.value for cell in sheet['A']]
col1_values = col1_values[1:]  # 排除 A1 单元格

# 拆分第一列单元格内容到新的工作表
unique_values = set(col1_values)
for value in unique_values:
    count = col1_values.count(value)
    new_sheet_name = f'{value} ({count} 人)'
    new_sheet = wb.create_sheet(title=new_sheet_name)

    # 在新工作表的第一行插入原工作表 A1 单元格的内容
    new_sheet.insert_rows(1)
    for col_num, cell in enumerate(sheet[1], 1):
        new_sheet.cell(row=1, column=col_num, value=cell.value)

    # 添加第二行单元格内容到新工作表
    new_sheet.append(row2_values)

    # 添加第一列单元格内容到新工作表
    for row_num, cell_value in enumerate(col1_values):
        if cell_value == value:
            new_sheet.append([cell.value for cell in sheet[row_num + 2]])

    # 删除新工作表中的空行
    for row in new_sheet.iter_rows():
        if all([cell.value is None for cell in row]):
            new_sheet.delete_rows(row[0].row)

    # 导出新工作表为单独的 Excel 文件
    file_name = f'{new_sheet_name}-{datetime.now().strftime('%Y%m%d')}.xlsx'
    new_wb = openpyxl.Workbook()
    new_wb.remove(new_wb.active)
    new_wb.add_sheet(new_sheet)
    new_wb.save(file_name)

# 删除工作表名字为表头(1)人的工作表
if '表头 (1 人)' in wb.sheetnames:
    wb.remove(wb['表头 (1 人)'])

代码说明

  1. 导入必要的库
    • openpyxl 用于操作 Excel 文件
    • datetime 用于获取当前日期
  2. 打开 Excel 文件
    • 使用 openpyxl.load_workbook() 函数打开指定路径的 Excel 文件
  3. 获取第一个工作表
    • 使用 wb.worksheets[0] 获取第一个工作表
  4. 冻结 A1 窗格
    • 使用 sheet.freeze_panes = 'A2' 冻结 A1 窗格,使第一行和第一列始终可见
  5. 获取第二行所有单元格的内容
    • 使用循环遍历第二行所有单元格,并将其值添加到 row2_values 列表中
  6. 获取第一列所有单元格的内容
    • 使用列表推导获取第一列所有单元格的值,并将第一个单元格(A1)的值排除
  7. 拆分第一列单元格内容到新的工作表
    • 使用 set() 获取第一列所有唯一值
    • 遍历所有唯一值,并根据每个值创建新的工作表,命名规则为“值 (重复次数) 人”。
    • 将第一行(原工作表 A1 单元格)内容复制到新工作表的第一行
    • 将第二行内容复制到新工作表
    • 将第一列中所有与当前值相同的行内容复制到新工作表
    • 删除新工作表中的空行
    • 将新工作表导出为单独的 Excel 文件,文件名为“工作表名称-当前日期.xlsx”。
  8. 删除工作表名字为“表头 (1 人)”的工作表
    • 使用 if '表头 (1 人)' in wb.sheetnames 判断工作表是否存在,如果存在则使用 wb.remove(wb['表头 (1 人)']) 删除该工作表。

代码运行结果

运行代码后,将根据第一列内容拆分出多个新的 Excel 文件,每个文件包含相应内容的所有行,并保留原工作表的第二行和第一行 A1 单元格内容。

总结

本教程演示了如何使用 Python 的 openpyxl 库拆分 Excel 表格,并根据第一列内容分类,并将每个工作表导出为单独的 Excel 文件。该方法可以帮助您快速高效地处理大型 Excel 表格,并方便数据分析和处理。

注意:

  • 请将代码中的 r'C:\Users\Administrator\Desktop\工作簿1.xlsx' 替换为您的实际 Excel 文件路径
  • 您可以根据需要修改代码中的工作表名和导出文件名的格式
  • 如果遇到任何问题,请在评论区留言
Python Openpyxl 库拆分 Excel 表格教程:按第一列内容分类并导出

原文地址: https://www.cveoy.top/t/topic/fXb0 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录