代码看起来没有明显的问题,但是需要注意以下几点:

  1. 需要安装Chrome浏览器和对应版本的ChromeDriver,否则会报错。
  2. 需要将代码中的“你的Cookie”替换成自己的豆瓣账号的Cookie。
  3. 现在豆瓣网站的反爬虫机制比较严格,爬取过程中可能会被检测出来,建议使用代理IP或者降低爬取频率来避免被封禁。
  4. 需要注意页面元素的定位方式和等待时间,否则会出现元素找不到或者超时的问题。可以使用Selenium提供的等待方法来解决这些问题。
import requestsfrom bs4 import BeautifulSoupfrom selenium import webdriverfrom seleniumwebdrivercommonby import Byfrom seleniumwebdrivercommonkeys import Keysfrom seleniumwebdriversupportui import Web

原文地址: http://www.cveoy.top/t/topic/g7fX 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录