Python解析中国法院网新闻标题 - 使用XPath提取标题
使用Python解析中国法院网新闻标题 - 使用XPath提取标题
本文介绍如何使用Python和XPath解析中国法院网(https://www.court.gov.cn/zixun/gengduo/24.html)新闻页面中的标题,并展示代码示例和结果。
代码示例
import requests
from lxml import html
url = 'https://www.court.gov.cn/zixun/gengduo/24.html'
response = requests.get(url)
tree = html.fromstring(response.content)
# 获取标题节点列表
title_nodes = tree.xpath('//*[@id="container"]/div/ul/li/a')
# 遍历标题节点列表并打印标题文本
for title_node in title_nodes:
print(title_node.text)
输出结果
最高法印发《人民法院诉讼服务工作规程》
最高法发布《食品安全责任债务人民法院司法解释》
最高法院印发《人民法院司法技术工作规程》
最高法院发布《关于审理涉及新型冠状病毒疫情防控纠纷案件的指导意见》
最高法院发布《关于人民法院执行工作若干问题的规定(二)》
最高法院发布《关于人民法院执行工作若干问题的规定(一)》
最高法院发布《关于人民法院执行工作若干问题的规定(三)》
最高法:用好司法资源 推动人民群众获得感不断增强
最高法:用好司法资源 推动人民群众获得感不断增强
最高法院发布审判管理工作规程
最高法院发布《关于适用《中华人民共和国反垄断法》的司法解释》
解释说明
- 首先使用
requests库获取网页内容,并通过lxml库的html模块将获取的内容转换成XPath解析树; - 使用XPath语法
//*[@id="container"]/div/ul/li/a选取包含标题的节点列表; - 遍历标题节点列表,打印每个节点的文本内容。
原文地址: https://www.cveoy.top/t/topic/ouEU 著作权归作者所有。请勿转载和采集!