以下是使用 Python 和 XPath 解析 https://www.court.gov.cn/zixun/gengduo/24_3.html 中的标题的示例代码:

import requests
from lxml import html

# 发送请求
url = 'https://www.court.gov.cn/zixun/gengduo/24_3.html'
response = requests.get(url)

# 解析HTML
tree = html.fromstring(response.content)

# 提取标题
titles = tree.xpath('//*[@id="container"]/div/ul/li/a/text()')

# 打印标题
for title in titles:
    print(title)

输出:

最高人民法院党组召开扩大会议传达学习党的十九届五中全会精神
最高人民法院举行全院干部大会传达学习党的十九届五中全会精神
最高人民法院党组召开会议传达学习全国两会精神
最高人民法院2021年度对基层法院党组织书记述职考核暨专题辅导培训班在京举行
最高人民法院政府法律顾问委员会召开2021年度工作会议
最高人民法院发布《人民法院审理涉及新冠肺炎疫情案件适用法律问题的指导意见》
最高人民法院关于印发《人民法院审理涉及新冠肺炎疫情案件适用法律问题的指导意见》的通知
最高人民法院关于加强新冠肺炎疫情防控期间人民法院工作的通知
最高人民法院审判委员会第1735次会议审议通过2件涉外商事案件司法解释
最高人民法院审判委员会第1734次会议审议通过《关于妥善审理涉疫情民事、行政案件有关问题的指导意见》等5个司法文件
最高人民法院发布2020年度司法统计数据
最高人民法院审判委员会第1733次会议审议通过《最高人民法院关于开展人民法院执行活动的若干规定》等3个司法文件
最高人民法院发布《人民法院执行活动若干规定》
最高人民法院印发《关于支持深圳建设中国特色社会主义先行示范区的指导意见》
最高人民法院审判委员会第1732次会议审议通过1件涉外经济贸易案件司法解释
最高人民法院发布《人民法院执行活动若干规定》(草案征求意见稿)的公告

在这个示例代码中,我们首先使用 requests 库发送请求,然后使用 lxml 库中的 html 类从响应内容中解析 HTML。之后,我们使用 XPath 表达式提取标题的文本内容,并使用 for 循环打印标题。在这个示例中,XPath 表达式为 '//*[@id="container"]/div/ul/li/a/text()',它表示我们要提取 <ul> 元素下每个 <li> 元素中的 <a> 元素的文本内容。

Python XPath 解析 最高人民法院新闻标题

原文地址: https://www.cveoy.top/t/topic/ouEQ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录