Python 爬取新冠肺炎疫情数据 - 实战指南
Python 可以使用第三方库 requests 和 BeautifulSoup 来采集新冠肺炎疫情数据。
首先,需要找到一个可靠的数据源。目前,世界卫生组织 (WHO) 和约翰斯·霍普金斯大学 (JHU) 提供了全球疫情数据的 API 接口,可以使用 Python 访问这些接口。
以下是使用 Python 采集约翰斯·霍普金斯大学提供的全球疫情数据的示例代码:
import requests
from bs4 import BeautifulSoup
url = 'https://coronavirus.jhu.edu/map.html'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
confirmed_cases = soup.find('div', {'class': 'maincounter-number'}).text.strip()
deaths = soup.find_all('div', {'class': 'maincounter-number'})[1].text.strip()
recovered = soup.find_all('div', {'class': 'maincounter-number'})[2].text.strip()
print(f'Confirmed cases: {confirmed_cases}')
print(f'Deaths: {deaths}')
print(f'Recovered: {recovered}')
这段代码使用 requests 库发送一个 GET 请求,获取约翰斯·霍普金斯大学提供的全球疫情数据页面的 HTML 代码。然后使用 BeautifulSoup 库解析 HTML 代码,找到页面中展示的累计确诊病例数、死亡人数和治愈人数,并输出到控制台上。
这只是一个简单的例子,实际采集数据时还需要考虑数据源的可靠性、数据格式的处理等问题。同时,还需要注意遵守数据源的使用规则和法律法规,以避免违法行为。
原文地址: https://www.cveoy.top/t/topic/n3vs 著作权归作者所有。请勿转载和采集!