使用Selenium库中的webdriver模块创建浏览器对象,可以选择Chrome、Firefox等浏览器。代码如下:

from selenium import webdriver

browser = webdriver.Chrome()  # 创建Chrome浏览器对象

访问url地址: 使用浏览器对象的get()方法访问url地址,代码如下:

url = 'https://movie.douban.com/subject/27074316/comments?status=P'
browser.get(url)  # 访问url地址

定位元素点击: 使用浏览器对象的find_element_by_xpath()或find_element_by_css_selector()方法定位元素,并使用click()方法模拟点击。代码如下:

# 使用XPath定位元素并点击
btn_next = browser.find_element_by_xpath('//a[@class="next"]')
btn_next.click()

# 使用CSS Selector定位元素并点击
btn_next = browser.find_element_by_css_selector('.next a')
btn_next.click()

完整代码示例:

from selenium import webdriver
import time

browser = webdriver.Chrome()
url = 'https://movie.douban.com/subject/27074316/comments?status=P'
browser.get(url)

while True:
    time.sleep(1)
    comments = browser.find_elements_by_css_selector('.comment-item')
    for comment in comments:
        print(comment.text)
    
try:
        btn_next = browser.find_element_by_xpath('//a[@class="next"]')
        btn_next.click()
    except:
        break
        
browser.quit()
Python爬虫实战:抓取豆瓣电影《穿靴子的猫2》所有影评数据

原文地址: https://www.cveoy.top/t/topic/oA0j 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录