写一个爬取网页图片的Python代码
下面是一个简单的Python代码,可以爬取指定网页中的图片并保存到本地:
import urllib
import requests
from bs4 import BeautifulSoup
# 指定要爬取的网页地址
url = "https://www.example.com"
# 发送HTTP请求
response = requests.get(url)
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.content, 'html.parser')
# 爬取所有的图片标签
img_tags = soup.find_all('img')
# 遍历所有的图片标签,获取其src属性值并下载到本地
for img_tag in img_tags:
img_url = img_tag['src']
img_name = img_url.split('/')[-1]
urllib.request.urlretrieve(img_url, img_name)
需要注意的是,上面的代码只能爬取指定网页中的图片,并且只能爬取该网页中直接引用的图片,对于通过CSS样式引用的图片无法爬取。如果要爬取多个网页中的图片,可以将上面的代码封装成一个函数,然后在循环中调用该函数即可。此外,还需要考虑一些异常情况,比如网络连接错误、文件名冲突等问题,需要根据实际情况进行处理。

原文地址: http://www.cveoy.top/t/topic/G7N 著作权归作者所有。请勿转载和采集!