python 使用selenium时如何获取页面源代码和当前浏览器session然后使用requests来模拟浏览器进行访问

日期: 2028-11-07

标签: 科技

获取页面源代码和当前浏览器session可以使用以下代码：

from selenium import webdriver

# 创建浏览器对象
browser = webdriver.Chrome()

# 访问页面
url = 'https://www.example.com'
browser.get(url)

# 获取页面源代码和当前浏览器session
page_source = browser.page_source
session = browser.get_cookie()

# 关闭浏览器
browser.quit()

然后可以使用requests库来模拟浏览器进行访问：

import requests

# 设置请求头，模拟浏览器请求
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

# 使用session进行请求
session = requests.session()
response = session.get(url, headers=headers, cookies=session)

# 输出页面源代码
print(response.text)

注意：在使用requests模拟浏览器进行访问时，需要注意请求头和cookie的设置，以及请求方法的选择（GET或POST）

python 使用selenium时如何获取页面源代码和当前浏览器session然后使用requests来模拟浏览器进行访问

原文地址: http://www.cveoy.top/t/topic/fJj4 著作权归作者所有。请勿转载和采集!