Python 自动获取网页文本:使用 requests 和 BeautifulSoup
以下是一个 Python 程序,它使用 requests 库获取一个网页,然后使用 BeautifulSoup 库解析 HTML 并提取文本:
import requests
from bs4 import BeautifulSoup
# 定义要访问的网页 URL
url = 'https://www.example.com'
# 发送 GET 请求获取网页内容
response = requests.get(url)
# 判断请求是否成功
if response.status_code == 200:
# 解析 HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 提取文本
text = soup.get_text()
print(text)
else:
print('请求失败')
在这个例子中,我们首先定义一个要访问的网页 URL,然后使用 requests 库发送一个 GET 请求。如果请求成功(即响应状态码为 200),我们使用 BeautifulSoup 库解析 HTML,并使用 get_text() 方法提取文本。最后,我们将提取的文本打印出来。
原文地址: https://www.cveoy.top/t/topic/lRur 著作权归作者所有。请勿转载和采集!