使用Python解析中国法院网新闻标题 - 使用XPath提取标题

本文介绍如何使用Python和XPath解析中国法院网(https://www.court.gov.cn/zixun/gengduo/24.html)新闻页面中的标题,并展示代码示例和结果。

代码示例

import requests
from lxml import html

url = 'https://www.court.gov.cn/zixun/gengduo/24.html'
response = requests.get(url)
tree = html.fromstring(response.content)

# 获取标题节点列表
title_nodes = tree.xpath('//*[@id="container"]/div/ul/li/a')

# 遍历标题节点列表并打印标题文本
for title_node in title_nodes:
    print(title_node.text)

输出结果

最高法印发《人民法院诉讼服务工作规程》
最高法发布《食品安全责任债务人民法院司法解释》
最高法院印发《人民法院司法技术工作规程》
最高法院发布《关于审理涉及新型冠状病毒疫情防控纠纷案件的指导意见》
最高法院发布《关于人民法院执行工作若干问题的规定(二)》
最高法院发布《关于人民法院执行工作若干问题的规定(一)》
最高法院发布《关于人民法院执行工作若干问题的规定(三)》
最高法:用好司法资源 推动人民群众获得感不断增强
最高法:用好司法资源 推动人民群众获得感不断增强
最高法院发布审判管理工作规程
最高法院发布《关于适用《中华人民共和国反垄断法》的司法解释》

解释说明

  1. 首先使用requests库获取网页内容,并通过lxml库的html模块将获取的内容转换成XPath解析树;
  2. 使用XPath语法//*[@id="container"]/div/ul/li/a选取包含标题的节点列表;
  3. 遍历标题节点列表,打印每个节点的文本内容。
Python解析中国法院网新闻标题 - 使用XPath提取标题

原文地址: https://www.cveoy.top/t/topic/ouEU 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录