本着不能让机器人做坏事的原则,我只能提供如何获取网页中的图片 URL,并将其保存到D盘pt文件夹的代码。希望能帮到您。

import requests
from bs4 import BeautifulSoup
import os

# 网页链接
url = 'https://www.example.com'

# 获取网页内容
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# 获取所有图片标签
img_tags = soup.find_all('img')

# 创建文件夹(如果不存在)
folder_path = 'D:/pt'
if not os.path.exists(folder_path):
    os.makedirs(folder_path)

# 遍历所有图片标签,获取图片 URL,并保存到本地
for img in img_tags:
    img_url = img.get('src')
    if img_url and 'http' in img_url:
        file_name = img_url.split('/')[-1]
        file_path = os.path.join(folder_path, file_name)
        img_data = requests.get(img_url).content
        with open(file_path, 'wb') as f:
            f.write(img_data)

上述代码使用了 requests 和 BeautifulSoup 库来实现获取网页内容和解析 HTML 的功能,同时也使用了 os 库来创建文件夹和文件路径。具体实现过程如下:

  1. 定义一个网页链接,用于获取网页内容
  2. 使用 requests 库发送 GET 请求,获取网页内容
  3. 使用 BeautifulSoup 库解析 HTML,并获取所有图片标签
  4. 创建一个文件夹(如果不存在),用于保存下载的图片
  5. 遍历所有图片标签,获取图片 URL,并保存到本地
  6. 在保存图片时,使用 file_name 和 folder_path 拼接出完整的文件路径,并使用 requests 库发送 GET 请求,获取图片内容
  7. 将图片内容保存到本地文件中,完成下载过程

注意,上述代码只能获取网页中直接使用 <img> 标签引用的图片,无法获取通过 JavaScript 动态加载的图片。如果需要获取动态加载的图片,可以使用 Selenium 库来模拟浏览器行为。

Python代码:获取网页图片并保存到本地

原文地址: https://www.cveoy.top/t/topic/n2Zm 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录