以下是一个简单的Python爬虫程序,可用于爬取哔哩哔哩首页的内容,并将结果保存到CSV文件中。

import requests
from bs4 import BeautifulSoup
import csv

url = 'https://www.bilibili.com/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

data = []
for item in soup.select('.video-card-reco'):
    title = item.select_one('.title').text.strip()
    type = item.select_one('.type').text.strip()
    cover = item.select_one('.lazy-img').get('src')
    data.append([title, type, cover])

with open('bilibili.csv', 'w', encoding='utf-8', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['Title', 'Type', 'Cover'])
    writer.writerows(data)

此程序使用requests和BeautifulSoup库来获取哔哩哔哩首页的HTML代码,并使用CSS选择器来提取视频卡片的标题,类型和封面图片。将结果保存到一个名为“bilibili.csv”的CSV文件中。文件使用UTF-8编码,每行数据以逗号分隔。

写一个爬取哔哩哔哩首页内容包括标题类型封面图片并将爬取的内容存在csv文件中的python代码

原文地址: https://www.cveoy.top/t/topic/bDxA 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录