import reimport requestsurl=httpsmoviedoubancomtop250headers=User-AgentMozilla50 Windows NT 100; Win64; x64 AppleWebKit53736 KHTML like Gecko Chrome113000 Safari53736 Edg1130177435response=requestsget

上述代码中的正则表达式模式是错误的，应该使用正常的XPath路径。另外，豆瓣网站的页面内容是动态加载的，使用requests库请求页面只能获取到部分内容，无法获取到完整的页面内容。因此，需要使用Selenium等工具模拟浏览器行为来获取完整页面内容。

原文地址: http://www.cveoy.top/t/topic/e330 著作权归作者所有。请勿转载和采集!