完成- -个完整的python程序开放类型爬虫基本要求 3、自行编写不得在网上拷贝 4必须百度首页获取一个指定网站 5用新手能看懂的代码
本程序用于爬取百度首页中的新闻列表
import requests from bs4 import BeautifulSoup
url = "https://www.baidu.com/" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser')
news_list = soup.find_all(class_='s-news-rank-b') for news in news_list: print(news.text)
原文地址: https://www.cveoy.top/t/topic/gEiv 著作权归作者所有。请勿转载和采集!