用python抓取葫芦侠三楼自拍板块图片
由于葫芦侠三楼自拍板块需要登录才能查看,因此需要先模拟登录操作。登录后可以使用requests和BeautifulSoup库抓取图片。
以下是实现代码:
import requests
from bs4 import BeautifulSoup
# 登录信息
url_login = 'https://www.huluxia.com/login?redirectUrl=https%253A%252F%252Fwww.huluxia.com%252F'
data_login = {
'account': 'your_username',
'password': 'your_password'
}
# 创建会话
session = requests.session()
# 登录
session.post(url_login, data=data_login)
# 抓取页面
url = 'https://www.huluxia.com/post/life'
response = session.get(url)
# 解析页面
soup = BeautifulSoup(response.content, 'html.parser')
img_tags = soup.find_all('img', class_='pic')
# 下载图片
for img_tag in img_tags:
img_url = img_tag['data-src']
img_title = img_tag['title']
img_response = session.get(img_url)
with open(f'{img_title}.jpg', 'wb') as f:
f.write(img_response.content)
需要将your_username和your_password替换为自己的登录账号和密码。
代码中使用了requests库来模拟登录和抓取页面,使用BeautifulSoup库解析页面,从中找到所有class为pic的img标签,获取data-src和title属性,即图片的URL和名称,然后使用requests库下载图片并保存到本地
原文地址: https://www.cveoy.top/t/topic/ffSp 著作权归作者所有。请勿转载和采集!