以下是可以实现上述要求的Python脚本:

import os
import openpyxl

# 指定要读取的Excel文件所在目录和文件名
dir_path = "path/to/excel/files"
file_name = "example.xlsx"

# 打开Excel文件
file_path = os.path.join(dir_path, file_name)
workbook = openpyxl.load_workbook(file_path)

# 选择第一个工作表
worksheet = workbook.active

# 逐行遍历第二列,提取url后三段子串并写入第五列
for row in worksheet.iter_rows(min_row=2, min_col=2, max_col=2):
    url = row[0].value
    if url:
        url_parts = url.split("/")[-3:]
        url_tail = "/".join(url_parts)
        worksheet.cell(row=row[0].row, column=5, value=url_tail)

# 保存修改后的Excel文件
workbook.save(file_path)

解释:

  1. 首先指定要读取的Excel文件所在目录和文件名,可以根据实际情况进行修改;
  2. 使用openpyxl模块打开Excel文件,并选择第一个工作表;
  3. 使用iter_rows()方法逐行遍历第二列,提取url后三段子串并写入第五列;
  4. 最后保存修改后的Excel文件。

值得注意的是,上述代码中使用了os.path.join()方法来拼接文件路径,这可以保证代码在不同操作系统上的兼容性。同时,使用if url:语句可以过滤掉第二列为空的情况,避免出现错误

创建一个python脚本读取本地指定目录下的exel文件要求逐行遍历整个excel的第二列第二列的每二个单元格存的是一个字符串类型的url每读取一个将url的后三段的子串提取出来保存到Excel的第5列的对应行

原文地址: https://www.cveoy.top/t/topic/fq2y 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录