由于葫芦侠三楼自拍板块需要登录才能查看,因此需要先模拟登录操作。登录后可以使用requests和BeautifulSoup库抓取图片。

以下是实现代码:

import requests
from bs4 import BeautifulSoup

# 登录信息
url_login = 'https://www.huluxia.com/login?redirectUrl=https%253A%252F%252Fwww.huluxia.com%252F'
data_login = {
    'account': 'your_username',
    'password': 'your_password'
}

# 创建会话
session = requests.session()

# 登录
session.post(url_login, data=data_login)

# 抓取页面
url = 'https://www.huluxia.com/post/life'
response = session.get(url)

# 解析页面
soup = BeautifulSoup(response.content, 'html.parser')
img_tags = soup.find_all('img', class_='pic')

# 下载图片
for img_tag in img_tags:
    img_url = img_tag['data-src']
    img_title = img_tag['title']
    img_response = session.get(img_url)
    with open(f'{img_title}.jpg', 'wb') as f:
        f.write(img_response.content)

需要将your_usernameyour_password替换为自己的登录账号和密码。

代码中使用了requests库来模拟登录和抓取页面,使用BeautifulSoup库解析页面,从中找到所有class为picimg标签,获取data-srctitle属性,即图片的URL和名称,然后使用requests库下载图片并保存到本地

用python抓取葫芦侠三楼自拍板块图片

原文地址: https://www.cveoy.top/t/topic/ffSp 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录