使用 Python 的 Selenium 库可以实现爬取 Tripadvisor 酒店供应商名称和价格的功能。首先,你需要安装 Selenium 库:

pip install selenium

然后,下载对应的 WebDriver,例如 ChromeDriver:https://sites.google.com/a/chromium.org/chromedriver/。

下载完成后,将 ChromeDriver 路径添加到系统环境变量中。

以下代码示例展示了如何打开指定的 Tripadvisor 酒店页面并爬取供应商名称和价格:

from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建 Chrome 浏览器实例
driver = webdriver.Chrome()

# 打开指定网站
url = "https://www.tripadvisor.com/Hotel_Review-g60745-d6485213-Reviews-The_Verb_Hotel-Boston_Massachusetts.html"
driver.get(url)

# 等待页面加载完成
driver.implicitly_wait(10)

# 爬取酒店供应商名称和价格
supplier_elements = driver.find_elements(By.CSS_SELECTOR, ".supplier_name")
price_elements = driver.find_elements(By.CSS_SELECTOR, ".price")

# 打印结果
for supplier, price in zip(supplier_elements, price_elements):
    print(supplier.text, price.text)

# 关闭浏览器实例
driver.quit()

该代码首先创建了一个 Chrome 浏览器实例,并使用 driver.get() 方法打开指定的 URL。接着,使用 driver.find_elements() 方法找到包含供应商名称和价格的元素。最后,使用 for 循环遍历这些元素,并使用 text 属性获取它们的文本内容。

注意:该代码示例假设你已正确配置 ChromeDriver 并将其路径添加到系统环境变量中。如果你使用其他浏览器,需要相应地修改代码并下载对应的 WebDriver。


原文地址: https://www.cveoy.top/t/topic/pVvQ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录