这段代码可以用于爬取网页中的所有图片,并将其保存到本地文件夹中。具体步骤如下:

  1. 导入需要使用的库,包括 'requests' 和 'BeautifulSoup'。
  2. 确定需要爬取的网页链接。
  3. 使用 'requests' 库获取网页内容,并使用 'BeautifulSoup' 库解析 HTML。
  4. 使用 'find_all' 方法获取所有图片标签。
  5. 创建本地文件夹,用于保存图片。
  6. 遍历所有图片标签,获取图片 URL,并保存到本地文件夹中。

需要注意的是,代码中使用的是绝对路径,如果需要修改成相对路径可以使用 'os.path.dirname(file)'。

import requests
from bs4 import BeautifulSoup
import os

# 网页链接
url = 'https://www.example.com'

# 获取网页内容
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# 获取所有图片标签
img_tags = soup.find_all('img')

# 创建文件夹(如果不存在)
folder_path = 'D:/pt'
if not os.path.exists(folder_path): os.makedirs(folder_path)

# 遍历所有图片标签,获取图片 URL,并保存到本地
for img in img_tags:
    img_url = img.get('src')
    if img_url and 'http' in img_url:
        file_name = img_url.split('/')[-1]
        file_path = os.path.join(folder_path, file_name)
        img_data = requests.get(img_url).content
        with open(file_path, 'wb') as f:
            f.write(img_data)
Python爬取网页图片:简单易懂的代码教程

原文地址: https://www.cveoy.top/t/topic/n20a 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录