Python 使用 XPath 获取网页标题 - 简单教程 - 常规

使用 Python 中的 lxml 库可以很方便地使用 XPath 来获取页面的标题数据。下面是一个示例代码：

import requests
from lxml import etree

# 发送请求获取页面内容
url = 'https://www.example.com'
response = requests.get(url)
html = response.text

# 使用lxml解析页面内容
tree = etree.HTML(html)

# 使用XPath获取页面的title数据
title = tree.xpath('//title/text()')[0]

print(title)

在上面的代码中，我们首先使用 requests 库发送请求获取页面的内容，然后使用 lxml 库中的 etree 模块解析页面内容。接着，我们使用 XPath 表达式 '//title/text()' 来获取页面的标题数据，'//title' 表示匹配所有的 title 元素，'/text()' 表示获取元素的文本内容。最后，我们打印出获取到的标题数据。

需要注意的是，XPath 返回的结果是一个列表，即使只匹配到一个元素也是如此。所以我们需要使用索引 [0] 来获取列表中的第一个元素。