Python爬虫教程:批量下载Wallspic高清壁纸
Python爬虫实战:批量下载Wallspic高清壁纸
想要快速下载大量高清壁纸?本教程将带你使用Python爬虫技术,从Wallspic网站(https://wallspic.com/cn)批量下载精美壁纸。
以下是完整的代码:
import requests
from bs4 import BeautifulSoup
import os
# 创建文件夹保存图片
folder_name = 'wallspic_images'
if not os.path.exists(folder_name):
os.makedirs(folder_name)
# 发送GET请求获取网页内容
url = 'https://wallspic.com/cn'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 查找所有图片标签并下载图片
image_tags = soup.find_all('img')
for image_tag in image_tags:
image_url = image_tag['src']
if image_url.startswith('https://'):
image_name = image_url.split('/')[-1]
image_path = os.path.join(folder_name, image_name)
with open(image_path, 'wb') as f:
image_response = requests.get(image_url)
f.write(image_response.content)
print(f'已下载图片: {image_name}')
代码解析:
- 导入必要的库:
requests: 用于发送HTTP请求获取网页内容。BeautifulSoup: 用于解析HTML网页结构,提取所需信息。os: 用于创建文件夹保存下载的图片。
- 创建文件夹:
- 代码首先创建一个名为'wallspic_images'的文件夹,用于存放下载的壁纸图片。
- 发送请求获取网页内容:
- 使用
requests.get(url)发送GET请求获取指定网页的HTML内容。
- 使用
- 解析网页,提取图片链接:
- 使用
BeautifulSoup(response.text, 'html.parser')将HTML内容解析成BeautifulSoup对象。 - 使用
soup.find_all('img')找到所有图片标签(<img>),并获取图片链接(src属性)。
- 使用
- 下载图片:
- 遍历所有图片链接,使用
requests.get(image_url)下载图片。 - 将下载的图片以二进制格式保存到创建的文件夹中,文件名根据图片链接自动获取。
- 遍历所有图片链接,使用
注意事项:
- 在运行代码之前,请确保已安装所需的Python库:
pip install requests beautifulsoup4 - 爬取网站内容需要遵守网站的使用规则和法律法规。请在使用此代码之前,确保你有权利爬取并下载Wallspic网站上的图片。
- 本代码仅供学习和参考,请勿用于商业用途或其他非法活动。
原文地址: https://www.cveoy.top/t/topic/fRlK 著作权归作者所有。请勿转载和采集!