用XPATH从网页爬取廊坊近7日天气的代码
由于没有提供具体的网站链接,以下示例代码仅供参考:
import requests
from lxml import etree
url = 'https://xxx.com/weather'
response = requests.get(url)
html = response.text
selector = etree.HTML(html)
# 获取近7日天气信息的XPath表达式
xpath_expr = '//div[@class="weather-container"]/div[position()<8]//div[@class="weather-info"]//text()'
weather_info = selector.xpath(xpath_expr)
print(weather_info)
其中,url需要替换为具体的网站链接,xpath_expr是获取近7日天气信息的XPath表达式。该表达式使用了相对路径,首先选取了class为weather-container的div元素,然后选取前7个子元素(即近7日天气的信息),最后选取子元素中class为weather-info的div元素下的所有文本节点,即可获取天气信息。
需要注意的是,由于不同网站的页面结构和元素属性可能不同,实际爬取时需要根据具体情况进行调整
原文地址: https://www.cveoy.top/t/topic/eYZH 著作权归作者所有。请勿转载和采集!