上述代码中的正则表达式模式是错误的,应该使用正常的XPath路径。另外,豆瓣网站的页面内容是动态加载的,使用requests库请求页面只能获取到部分内容,无法获取到完整的页面内容。因此,需要使用Selenium等工具模拟浏览器行为来获取完整页面内容。


原文地址: http://www.cveoy.top/t/topic/e330 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录