1. 导入两个模块:'os' 和 'openpyxl'。
  2. 定义一个字符串变量 'dir_path',表示文件夹路径。
  3. 定义一个字符串变量 'file_name',表示文件名。
  4. 使用 'os.path.join()' 方法,将 'dir_path' 和 'file_name' 合并成一个完整的文件路径,赋值给变量 'file_path'。
  5. 使用 'openpyxl.load_workbook()' 方法,加载文件路径为 'file_path' 的 Excel 文件,将其赋值给变量 'workbook'。
  6. 使用 'workbook.active' 方法,获取 Excel 文件的活动工作表对象,将其赋值给变量 'worksheet'。
  7. 使用 'worksheet.iter_rows' 方法,遍历工作表中第 2 列(即 B 列)中的所有行,从第 2 行(即 'min_row=2')开始,到最后一行(即未指定 'max_row' 参数),每次只取第 2 列(即 'min_col=2','max_col=2')。
  8. 对于每一行,使用 'row[0].value' 获取第 2 列中的值,将其赋值给变量 'url'。
  9. 如果 'url' 不为空(即 'if url:' 成立),则将其按 '/' 分割,取最后三个部分(即 'url.split("/")[-3:]'),将其组成新的字符串,赋值给变量 'url_tail'。
  10. 使用 'worksheet.cell()' 方法,将 'url_tail' 的值写入到该行的第 5 列(即 E 列)。
  11. 最后,使用 'workbook.save()' 方法,将修改后的 Excel 文件保存到原文件路径中,完成操作。
Python 使用 openpyxl 解析 Excel 文件并提取 URL 尾部

原文地址: https://www.cveoy.top/t/topic/ofIu 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录