以下是一个简单的Python程序,可以爬取指定网站的图片,并将其保存到本地。

import requests
import os

# 定义爬取图片的函数
def download_images(url, folder):
    # 发送请求
    response = requests.get(url)
    # 如果请求成功
    if response.status_code == 200:
        # 获取图片的名称
        image_name = url.split("/")[-1]
        # 拼接保存路径
        save_path = os.path.join(folder, image_name)
        # 保存图片到本地
        with open(save_path, "wb") as f:
            f.write(response.content)
        print(f"图片 {image_name} 保存成功!")

# 指定要爬取的网站和保存路径
website_url = "https://www.example.com/"
save_folder = "./images/"

# 发送请求获取网页内容
response = requests.get(website_url)

# 如果请求成功
if response.status_code == 200:
    # 解析网页内容,提取所有图片的URL
    image_urls = []
    for line in response.text.split("\n"):
        if "<img" in line:
            start = line.find("src=") + 5
            end = line.find('"', start)
            image_url = line[start:end]
            if image_url.startswith("http"):
                image_urls.append(image_url)

    # 依次下载图片
    if not os.path.exists(save_folder):
        os.makedirs(save_folder)
    for url in image_urls:
        download_images(url, save_folder)
else:
    print("请求失败!")

你需要修改以下变量:

  • website_url:要爬取图片的网站URL。
  • save_folder:图片保存的文件夹路径。

注意:

  • 该程序只能爬取直接在HTML代码中以<img>标签形式出现的图片,如果图片是通过JavaScript动态加载的,则无法爬取。
  • 爬取图片可能会涉及版权问题,请确保你有合法的使用权。
帮忙写一个python代码,爬取网站图片,可以保存到本地

原文地址: https://www.cveoy.top/t/topic/ufT 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录