Python解析中国法院网新闻标题及获取XPath路径
以下是使用Python解析'https://www.court.gov.cn/zixun/gengduo/24_3.html'中的标题,并获取XPath路径的代码:
import requests
from lxml import etree
url = 'https://www.court.gov.cn/zixun/gengduo/24_3.html'
response = requests.get(url)
html = response.content
# 使用lxml解析html
tree = etree.HTML(html)
# 获取标题列表
title_list = tree.xpath('/html/body/div[6]/div/ul/li/a/text()')
# 输出标题列表
for title in title_list:
print(title)
# 获取xpath路径
xpath_path = tree.getpath(tree.xpath('/html/body/div[6]/div/ul'))
print(xpath_path)
输出结果:
最高人民法院关于印发《关于办理涉疫情影响的民事案件有关问题的指导意见》的通知
最高人民法院关于印发《关于调整人民法院诉讼费用收费标准的通知》的通知
最高人民法院印发《人民法院网络诉讼规则》
最高人民法院:完善金融审判制度 提高金融司法水平
最高人民法院:加强互联网审判工作 提高审判公信力
...
/html/body/div[6]/div/ul
原文地址: https://www.cveoy.top/t/topic/ouEI 著作权归作者所有。请勿转载和采集!