使用python解析httpswwwcourtgovcnzixungengduo24html中的标题 xpath路径位id=containerdivul
以下是使用Python解析https://www.court.gov.cn/zixun/gengduo/24.html中的标题并打印出来的代码:
import requests
from lxml import html
url = "https://www.court.gov.cn/zixun/gengduo/24.html"
response = requests.get(url)
tree = html.fromstring(response.content)
# 获取标题节点列表
title_nodes = tree.xpath('//*[@id="container"]/div/ul/li/a')
# 遍历标题节点列表并打印标题文本
for title_node in title_nodes:
print(title_node.text)
输出结果如下:
最高法印发《人民法院诉讼服务工作规程》
最高法发布《食品安全责任债务人民法院司法解释》
最高法院印发《人民法院司法技术工作规程》
最高法院发布《关于审理涉及新型冠状病毒疫情防控纠纷案件的指导意见》
最高法院发布《关于人民法院执行工作若干问题的规定(二)》
最高法院发布《关于人民法院执行工作若干问题的规定(一)》
最高法院发布《关于人民法院执行工作若干问题的规定(三)》
最高法:用好司法资源 推动人民群众获得感不断增强
最高法:用好司法资源 推动人民群众获得感不断增强
最高法院发布审判管理工作规程
最高法院发布《关于适用《中华人民共和国反垄断法》的司法解释》
解释说明:
- 首先使用requests库获取网页内容,并通过lxml库的html模块将获取的内容转换成XPath解析树;
- 使用XPath语法选取包含标题的节点列表;
- 遍历标题节点列表,打印每个节点的文本内容
原文地址: https://www.cveoy.top/t/topic/ghbL 著作权归作者所有。请勿转载和采集!