以下是一个使用 Python 爬取微博热搜榜单的示例脚本:

import requests
from bs4 import BeautifulSoup

# 发送请求获取页面内容
url = 'https://s.weibo.com/top/summary?cate=realtimehot'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0;Win64) AppleWebkit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.102 Safari/537.36'}
response = requests.get(url, headers=headers)
html = response.text

# 解析页面内容获取热搜榜单
soup = BeautifulSoup(html, 'html.parser')
hot_list = soup.select('.td-02 a')

# 打印热搜榜单
for hot in hot_list:
    print(hot.text)

这个脚本使用了 requests 库发送 HTTP 请求,以获取微博热搜页面的 HTML 内容。然后使用 BeautifulSoup 库解析 HTML,并使用 CSS 选择器来提取热搜榜单的内容。最后,遍历热搜榜单,并打印每个热搜的文本。

请注意,微博可能会对爬虫进行限制或封禁相关 IP,所以在实际使用时请遵守网站的使用规则,并设置合理的爬取频率。

Python 爬取微博热搜榜单脚本

原文地址: https://www.cveoy.top/t/topic/qz5Q 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录