from lxml import etreetext = ul id=ultest li class=item-0a href=link1htmlfirst itemali li class=item-1a href=link2htmlsecond itemali li class=item-inactivea href=link3html
#调用HTML类进行初始化,这样就成功构造了一个XPath解析对象。 page = etree.HTML(text)
打印输出第三个li标签
print(page.xpath('//li[3]'))
#打印输出li标签下所有属性节点: li_list = page.xpath('//li') for li in li_list: print(li.attrib)
#打印输出a标签的内容,用text() a_list = page.xpath('//a') for a in a_list: print(a.text)
#打印输出ul标签下的所有内容,用string() ul = page.xpath('//ul')[0] print(ul.xpath('string()'))
原文地址: https://www.cveoy.top/t/topic/eYZt 著作权归作者所有。请勿转载和采集!