Python Openpyxl 库拆分表格并保存成独立文件
使用 Python Openpyxl 库拆分 Excel 表格并保存为独立文件
该脚本使用 Python 3.8 版本的 Openpyxl 库,从一个 Excel 文件中提取第一列数据,并根据其内容将数据拆分到不同的工作表中。每个新工作表包含第一列中相同单元格内容的所有数据。
主要功能:
- 打开 Excel 文件并获取第一个工作表。
- 冻结 A1 窗格。
- 获取第二行所有单元格的内容。
- 获取第一列所有单元格的内容并排除 A1 单元格。
- 根据第一列中重复的单元格内容创建新的工作表。
- 将第二行和相同单元格内容的所有数据添加到新工作表。
- 合并新工作表的第一行单元格并居中。
- 删除新工作表中的空行。
- 将每个新工作表保存为独立的 Excel 文件。
- 删除原始工作表中名为 '表头 (1 人)' 的工作表。
- 保存修改后的 Excel 文件。
代码示例:
import openpyxl
# 打开 Excel 文件
wb = openpyxl.load_workbook(r'C:\Users\Administrator\Desktop\工作簿1.xlsx')
# 获取第一个工作表
sheet = wb.worksheets[0]
# 冻结 A1 窗格
sheet.freeze_panes = 'A2'
# 获取第二行所有单元格的内容
row2_values = []
for cell in sheet[2]:
row2_values.append(cell.value)
print(row2_values)
# 获取第一列所有单元格的内容
col1_values = [cell.value for cell in sheet['A']]
col1_values = col1_values[1:] # 排除 A1 单元格
# 用字典存储每个重复单元格的行号
unique_values = {}
for i, value in enumerate(col1_values):
if value in unique_values:
unique_values[value].append(i + 2)
else:
unique_values[value] = [i + 2]
# 创建新的工作表
for value, rows in unique_values.items():
count = len(rows)
new_sheet_name = f'{value} ({count} 人)'
new_sheet = wb.create_sheet(title=new_sheet_name)
# 在新工作表的第一行插入原工作表 A1 单元格的内容
new_sheet.insert_rows(1)
for col_num, cell in enumerate(sheet[1], 1):
new_sheet.cell(row=1, column=col_num, value=cell.value)
# 添加第二行单元格内容到新工作表
new_sheet.append(row2_values)
# 添加重复单元格的内容到新工作表
for row in rows:
new_sheet.append([cell.value for cell in sheet[row]])
# 删除新工作表中的空行
for row in new_sheet.iter_rows():
if all([cell.value is None for cell in row]):
new_sheet.delete_rows(row[0].row)
# 合并第一行单元格并居中
max_col = new_sheet.max_column
new_sheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=max_col)
new_sheet.cell(row=1, column=1).value = sheet.cell(row=1, column=1).value
new_sheet.cell(row=1, column=1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center')
# 保存新工作表
new_wb = openpyxl.Workbook()
new_wb.remove(new_wb.active)
new_wb.add(new_sheet)
new_wb.save(f'{new_sheet_name}.xlsx')
# 删除工作表名字为表头(1)人的工作表
if '表头 (1 人)' in wb.sheetnames:
wb.remove(wb['表头 (1 人)'])
# 保存修改后的 Excel 文件
wb.save(r'C:\Users\Administrator\Desktop\工作簿1.xlsx')
注意:
- 将代码中的
工作簿1.xlsx替换为实际的 Excel 文件名。 - 代码中的路径需要根据实际情况进行修改。
- 确保已安装 Openpyxl 库。如果没有安装,可以使用
pip install openpyxl命令安装。
运行结果:
该脚本将根据第一列中重复单元格的内容创建新的工作表,并将相关数据添加到新工作表中。每个新工作表将以 '单元格内容 (重复数量) 人' 的格式命名,并保存为单独的 Excel 文件。
示例:
例如,如果第一列中包含以下单元格内容:
- 张三
- 李四
- 王五
- 张三
- 王五
- 李四
那么该脚本将创建以下三个新的工作表:
- 张三 (2 人)
- 李四 (2 人)
- 王五 (2 人)
每个工作表都将包含相关数据。
总结:
该脚本使用 Openpyxl 库,从一个 Excel 文件中提取第一列数据,并根据其内容将数据拆分到不同的工作表中,每个新工作表包含第一列中相同单元格内容的所有数据。同时,该脚本还实现了冻结 A1 窗格、获取第二行单元格内容、合并第一行单元格并居中、删除空行等功能,并最终将每个新工作表保存为独立的 Excel 文件。
原文地址: https://www.cveoy.top/t/topic/fXcp 著作权归作者所有。请勿转载和采集!