Python解析中国法院网新闻标题 - 使用XPath提取标题

日期: 2024-11-06
标签: 常规

使用Python解析中国法院网新闻标题 - 使用XPath提取标题

本文介绍如何使用Python和XPath解析中国法院网（https://www.court.gov.cn/zixun/gengduo/24.html）新闻页面中的标题，并展示代码示例和结果。

代码示例

import requests
from lxml import html

url = 'https://www.court.gov.cn/zixun/gengduo/24.html'
response = requests.get(url)
tree = html.fromstring(response.content)

# 获取标题节点列表
title_nodes = tree.xpath('//*[@id="container"]/div/ul/li/a')

# 遍历标题节点列表并打印标题文本
for title_node in title_nodes:
    print(title_node.text)

输出结果

最高法印发《人民法院诉讼服务工作规程》
最高法发布《食品安全责任债务人民法院司法解释》
最高法院印发《人民法院司法技术工作规程》
最高法院发布《关于审理涉及新型冠状病毒疫情防控纠纷案件的指导意见》
最高法院发布《关于人民法院执行工作若干问题的规定（二）》
最高法院发布《关于人民法院执行工作若干问题的规定（一）》
最高法院发布《关于人民法院执行工作若干问题的规定（三）》
最高法：用好司法资源 推动人民群众获得感不断增强
最高法：用好司法资源 推动人民群众获得感不断增强
最高法院发布审判管理工作规程
最高法院发布《关于适用《中华人民共和国反垄断法》的司法解释》

解释说明

首先使用requests库获取网页内容，并通过lxml库的html模块将获取的内容转换成XPath解析树；
使用XPath语法//*[@id="container"]/div/ul/li/a选取包含标题的节点列表；
遍历标题节点列表，打印每个节点的文本内容。

Python解析中国法院网新闻标题 - 使用XPath提取标题

原文地址: https://www.cveoy.top/t/topic/ouEU 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录

上一篇: Table Definition: Furniture Description with Properties
下一篇: DDSM 乳腺X线照片数据库：用于癌症筛查和诊断的宝贵资源