帮忙写一个python代码,爬取网站图片,可以保存到本地
以下是一个简单的Python程序,可以爬取指定网站的图片,并将其保存到本地。
import requests
import os
# 定义爬取图片的函数
def download_images(url, folder):
# 发送请求
response = requests.get(url)
# 如果请求成功
if response.status_code == 200:
# 获取图片的名称
image_name = url.split("/")[-1]
# 拼接保存路径
save_path = os.path.join(folder, image_name)
# 保存图片到本地
with open(save_path, "wb") as f:
f.write(response.content)
print(f"图片 {image_name} 保存成功!")
# 指定要爬取的网站和保存路径
website_url = "https://www.example.com/"
save_folder = "./images/"
# 发送请求获取网页内容
response = requests.get(website_url)
# 如果请求成功
if response.status_code == 200:
# 解析网页内容,提取所有图片的URL
image_urls = []
for line in response.text.split("\n"):
if "<img" in line:
start = line.find("src=") + 5
end = line.find('"', start)
image_url = line[start:end]
if image_url.startswith("http"):
image_urls.append(image_url)
# 依次下载图片
if not os.path.exists(save_folder):
os.makedirs(save_folder)
for url in image_urls:
download_images(url, save_folder)
else:
print("请求失败!")
你需要修改以下变量:
website_url:要爬取图片的网站URL。save_folder:图片保存的文件夹路径。
注意:
- 该程序只能爬取直接在HTML代码中以
<img>标签形式出现的图片,如果图片是通过JavaScript动态加载的,则无法爬取。 - 爬取图片可能会涉及版权问题,请确保你有合法的使用权。
原文地址: https://www.cveoy.top/t/topic/ufT 著作权归作者所有。请勿转载和采集!