Python 爬取网页中的 JavaScript 数据 - 使用 requests 和 BeautifulSoup - 常规

要爬取网页中的 script 标签内的 JavaScript 数据，可以使用 Python 中的 requests 和 BeautifulSoup 库进行操作。

首先，使用 requests 库发送 HTTP 请求，获取网页的 HTML 内容。然后，使用 BeautifulSoup 库解析 HTML 内容，找到 script 标签中的数据。

以下是一个示例代码：

import requests
from bs4 import BeautifulSoup
import re

# 发送 HTTP 请求，获取网页内容
url = 'https://example.com'
response = requests.get(url)
html = response.text

# 使用 BeautifulSoup 解析 HTML 内容
soup = BeautifulSoup(html, 'html.parser')

# 找到所有的 script 标签
scripts = soup.find_all('script')

# 遍历 script 标签，提取数据
for script in scripts:
    # 使用正则表达式匹配数据
    match = re.search(r'var data = (.*?);', script.string)
    if match:
        data = match.group(1)
        # 处理数据
        print(data)

在上述代码中，首先使用 requests 库发送 HTTP 请求，获取网页的 HTML 内容。然后，使用 BeautifulSoup 库解析 HTML 内容，找到所有的 script 标签。接着，使用正则表达式匹配 script 标签中的数据，并进行处理。

请注意，这只是一个示例代码，具体的处理方式和正则表达式可能需要根据实际情况进行调整。

Python 爬取网页中的 JavaScript 数据 - 使用 requests 和 BeautifulSoup