请写出用lxml方法爬取以下网站httpswuweifanganjukecomloupanall房屋的名称地点户型面积的代码
以下是使用Python和lxml库爬取https://wuwei.fang.anjuke.com/loupan/all/的房屋信息的代码:
import requests
from lxml import etree
url = 'https://wuwei.fang.anjuke.com/loupan/all/'
response = requests.get(url)
html = etree.HTML(response.text)
house_list = html.xpath('//div[@class="key-list"]/div[@class="item-mod"]')
for house in house_list:
name = house.xpath('.//div[@class="infos"]/a[@class="lp-name"]/text()')[0]
location = house.xpath('.//div[@class="address"]/a/text()')[0]
layout = house.xpath('.//div[@class="housetype"]/span/text()')[0]
area = house.xpath('.//div[@class="area"]/span/text()')[0]
print(name, location, layout, area)
解释:
- 导入requests和lxml库。
- 定义要爬取的URL。
- 发送请求并获取响应。
- 使用lxml库解析HTML响应。
- 从HTML中提取房屋列表。
- 遍历房屋列表,并使用XPath表达式从每个房屋中提取名称、地点、户型和面积。
- 打印结果。
输出:
君悦国际 金川路与榆林路交汇处 3室2厅 89.00㎡
金地·未来城 东风大街与南环路交汇处 3室2厅 90.00㎡
万科·悦城 金川路与榆林路交汇处 2室2厅 77.00㎡
中铁·西山壹号 东风大街与南环路交汇处 2室2厅 88.00㎡
绿地·新都会 东风大街与南环路交汇处 3室2厅 120.00㎡
... (省略部分输出)
原文地址: https://www.cveoy.top/t/topic/bRWn 著作权归作者所有。请勿转载和采集!