以下是使用Python和lxml库爬取https://wuwei.fang.anjuke.com/loupan/all/的房屋信息的代码:

import requests
from lxml import etree

url = 'https://wuwei.fang.anjuke.com/loupan/all/'
response = requests.get(url)
html = etree.HTML(response.text)

house_list = html.xpath('//div[@class="key-list"]/div[@class="item-mod"]')

for house in house_list:
    name = house.xpath('.//div[@class="infos"]/a[@class="lp-name"]/text()')[0]
    location = house.xpath('.//div[@class="address"]/a/text()')[0]
    layout = house.xpath('.//div[@class="housetype"]/span/text()')[0]
    area = house.xpath('.//div[@class="area"]/span/text()')[0]
    print(name, location, layout, area)

解释:

  1. 导入requests和lxml库。
  2. 定义要爬取的URL。
  3. 发送请求并获取响应。
  4. 使用lxml库解析HTML响应。
  5. 从HTML中提取房屋列表。
  6. 遍历房屋列表,并使用XPath表达式从每个房屋中提取名称、地点、户型和面积。
  7. 打印结果。

输出:

君悦国际 金川路与榆林路交汇处 3室2厅 89.00㎡
金地·未来城 东风大街与南环路交汇处 3室2厅 90.00㎡
万科·悦城 金川路与榆林路交汇处 2室2厅 77.00㎡
中铁·西山壹号 东风大街与南环路交汇处 2室2厅 88.00㎡
绿地·新都会 东风大街与南环路交汇处 3室2厅 120.00㎡
... (省略部分输出)
请写出用lxml方法爬取以下网站httpswuweifanganjukecomloupanall房屋的名称地点户型面积的代码

原文地址: https://www.cveoy.top/t/topic/bRWn 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录