Python爬虫实战:使用PyCharm抓取广东科学技术职业学院首页
你可以使用Python的requests库和BeautifulSoup库来编写一个简单的爬虫程序。下面是一个示例代码:
import requests
from bs4 import BeautifulSoup
# 发送GET请求获取网页内容
url = 'http://www.gdit.edu.cn/'
response = requests.get(url)
content = response.text
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(content, 'html.parser')
# 打印网页内容
print(soup)
# 将网页内容保存为文件
with open('gdit.html', 'w', encoding='utf-8') as file:
file.write(str(soup))
运行这段代码后,你将会看到广东科学技术职业学院首页的内容被打印出来,并且一个名为'gdit.html'的文件被保存在当前目录下,其中包含了网页的内容。
原文地址: https://www.cveoy.top/t/topic/jwuL 著作权归作者所有。请勿转载和采集!