Python Selenium 爬取 Tripadvisor 酒店供应商名称和价格
使用 Python 的 Selenium 库可以实现爬取 Tripadvisor 酒店供应商名称和价格的功能。首先,你需要安装 Selenium 库:
pip install selenium
然后,下载对应的 WebDriver,例如 ChromeDriver:https://sites.google.com/a/chromium.org/chromedriver/。
下载完成后,将 ChromeDriver 路径添加到系统环境变量中。
以下代码示例展示了如何打开指定的 Tripadvisor 酒店页面并爬取供应商名称和价格:
from selenium import webdriver
from selenium.webdriver.common.by import By
# 创建 Chrome 浏览器实例
driver = webdriver.Chrome()
# 打开指定网站
url = "https://www.tripadvisor.com/Hotel_Review-g60745-d6485213-Reviews-The_Verb_Hotel-Boston_Massachusetts.html"
driver.get(url)
# 等待页面加载完成
driver.implicitly_wait(10)
# 爬取酒店供应商名称和价格
supplier_elements = driver.find_elements(By.CSS_SELECTOR, ".supplier_name")
price_elements = driver.find_elements(By.CSS_SELECTOR, ".price")
# 打印结果
for supplier, price in zip(supplier_elements, price_elements):
print(supplier.text, price.text)
# 关闭浏览器实例
driver.quit()
该代码首先创建了一个 Chrome 浏览器实例,并使用 driver.get() 方法打开指定的 URL。接着,使用 driver.find_elements() 方法找到包含供应商名称和价格的元素。最后,使用 for 循环遍历这些元素,并使用 text 属性获取它们的文本内容。
注意:该代码示例假设你已正确配置 ChromeDriver 并将其路径添加到系统环境变量中。如果你使用其他浏览器,需要相应地修改代码并下载对应的 WebDriver。
原文地址: https://www.cveoy.top/t/topic/pVvQ 著作权归作者所有。请勿转载和采集!