import reimport requestsurl=httpsmoviedoubancomtop250headers=User-AgentMozilla50 Windows NT 100; Win64; x64 AppleWebKit53736 KHTML like Gecko Chrome113000 Safari53736 Edg1130177435response=requestsget
上述代码中的正则表达式模式是错误的,应该使用正常的XPath路径。另外,豆瓣网站的页面内容是动态加载的,使用requests库请求页面只能获取到部分内容,无法获取到完整的页面内容。因此,需要使用Selenium等工具模拟浏览器行为来获取完整页面内容。
原文地址: http://www.cveoy.top/t/topic/e330 著作权归作者所有。请勿转载和采集!