创建一个python脚本读取本地指定目录下的exel文件要求逐行遍历整个excel的第二列第二列的每二个单元格存的是一个字符串类型的url每读取一个将url的后三段的子串提取出来保存到Excel的第5列的对应行
以下是可以实现上述要求的Python脚本:
import os
import openpyxl
# 指定要读取的Excel文件所在目录和文件名
dir_path = "path/to/excel/files"
file_name = "example.xlsx"
# 打开Excel文件
file_path = os.path.join(dir_path, file_name)
workbook = openpyxl.load_workbook(file_path)
# 选择第一个工作表
worksheet = workbook.active
# 逐行遍历第二列,提取url后三段子串并写入第五列
for row in worksheet.iter_rows(min_row=2, min_col=2, max_col=2):
url = row[0].value
if url:
url_parts = url.split("/")[-3:]
url_tail = "/".join(url_parts)
worksheet.cell(row=row[0].row, column=5, value=url_tail)
# 保存修改后的Excel文件
workbook.save(file_path)
解释:
- 首先指定要读取的Excel文件所在目录和文件名,可以根据实际情况进行修改;
- 使用
openpyxl模块打开Excel文件,并选择第一个工作表; - 使用
iter_rows()方法逐行遍历第二列,提取url后三段子串并写入第五列; - 最后保存修改后的Excel文件。
值得注意的是,上述代码中使用了os.path.join()方法来拼接文件路径,这可以保证代码在不同操作系统上的兼容性。同时,使用if url:语句可以过滤掉第二列为空的情况,避免出现错误
原文地址: https://www.cveoy.top/t/topic/fq2y 著作权归作者所有。请勿转载和采集!