#调用HTML类进行初始化,这样就成功构造了一个XPath解析对象。 page = etree.HTML(text)

打印输出第三个li标签

print(page.xpath('//li[3]'))

#打印输出li标签下所有属性节点: li_list = page.xpath('//li') for li in li_list: print(li.attrib)

#打印输出a标签的内容,用text() a_list = page.xpath('//a') for a in a_list: print(a.text)

#打印输出ul标签下的所有内容,用string() ul = page.xpath('//ul')[0] print(ul.xpath('string()'))

from lxml import etreetext = ul id=ultest li class=item-0a href=link1htmlfirst itemali li class=item-1a href=link2htmlsecond itemali li class=item-inactivea href=link3html

原文地址: https://www.cveoy.top/t/topic/eYZt 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录