Python 爬取新冠肺炎疫情数据 - 实战指南 - 常规

Python 可以使用第三方库 requests 和 BeautifulSoup 来采集新冠肺炎疫情数据。

首先，需要找到一个可靠的数据源。目前，世界卫生组织 (WHO) 和约翰斯·霍普金斯大学 (JHU) 提供了全球疫情数据的 API 接口，可以使用 Python 访问这些接口。

以下是使用 Python 采集约翰斯·霍普金斯大学提供的全球疫情数据的示例代码：

import requests
from bs4 import BeautifulSoup

url = 'https://coronavirus.jhu.edu/map.html'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')

confirmed_cases = soup.find('div', {'class': 'maincounter-number'}).text.strip()
deaths = soup.find_all('div', {'class': 'maincounter-number'})[1].text.strip()
recovered = soup.find_all('div', {'class': 'maincounter-number'})[2].text.strip()

print(f'Confirmed cases: {confirmed_cases}')
print(f'Deaths: {deaths}')
print(f'Recovered: {recovered}')

这段代码使用 requests 库发送一个 GET 请求，获取约翰斯·霍普金斯大学提供的全球疫情数据页面的 HTML 代码。然后使用 BeautifulSoup 库解析 HTML 代码，找到页面中展示的累计确诊病例数、死亡人数和治愈人数，并输出到控制台上。

这只是一个简单的例子，实际采集数据时还需要考虑数据源的可靠性、数据格式的处理等问题。同时，还需要注意遵守数据源的使用规则和法律法规，以避免违法行为。