Python Selenium 获取页面源代码和Session,并用Requests模拟浏览器访问
获取页面源代码和当前浏览器 Session 可以使用以下代码:
from selenium import webdriver
# 创建浏览器对象
browser = webdriver.Chrome()
# 访问页面
url = 'https://www.example.com'
browser.get(url)
# 获取页面源代码和当前浏览器 Session
page_source = browser.page_source
session = browser.get_cookie()
# 关闭浏览器
browser.quit()
然后可以使用 Requests 库来模拟浏览器进行访问:
import requests
# 设置请求头,模拟浏览器请求
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 使用 Session 进行请求
session = requests.session()
response = session.get(url, headers=headers, cookies=session)
# 输出页面源代码
print(response.text)
注意:在使用 Requests 模拟浏览器进行访问时,需要注意请求头和 Cookie 的设置,以及请求方法的选择(GET 或 POST)。
原文地址: https://www.cveoy.top/t/topic/ooVD 著作权归作者所有。请勿转载和采集!