Python数据分析:PM2.5数据统计与可视化分析
- 使用pandas库中的
read_csv函数读取PM25data数据,代码如下:
import pandas as pd
data = pd.read_csv('PM25data.csv')
- 获取平均气温、平均相对湿度、降水量、日照时数等变量,代码如下:
mean_temp = data['平均气温']
mean_rh = data['平均相对湿度']
precipitation = data['降水量']
sunshine_hours = data['日照时数']
- 使用numpy库计算期望、方差、四分位数、偏度系数和峰度系数,代码如下:
import numpy as np
# 期望
mean = np.mean(data)
# 方差
variance = np.var(data)
# 四分位数
quartiles = np.percentile(data, [25, 50, 75])
# 偏度系数
skewness = np.mean((data - np.mean(data)) ** 3) / np.power(np.var(data), 1.5)
# 峰度系数
kurt = np.mean((data - np.mean(data)) ** 4) / np.power(np.var(data), 2) - 3
- 根据经度或纬度信息将城市分为沿海城市和非沿海城市,代码如下:
# 根据经度分组
coastal_cities = data[data['经度'] > 110]
non_coastal_cities = data[data['经度'] <= 110]
# 根据纬度分组
coastal_cities = data[data['纬度'] > 20]
non_coastal_cities = data[data['纬度'] <= 20]
然后分别计算上述的统计量。
- 使用matplotlib库中的
scatter函数将PM2.5年均浓度点到图上,以是否沿海作为颜色区分,以海拔变量作为点的大小的度量,代码如下:
import matplotlib.pyplot as plt
# 绘制沿海城市的散点图
coastal_cities = data[data['经度'] > 110]
plt.scatter(coastal_cities['经度'], coastal_cities['纬度'], c=coastal_cities['是否沿海'], s=coastal_cities['海拔'])
# 绘制非沿海城市的散点图
non_coastal_cities = data[data['经度'] <= 110]
plt.scatter(non_coastal_cities['经度'], non_coastal_cities['纬度'], c=non_coastal_cities['是否沿海'], s=non_coastal_cities['海拔'])
plt.show()
其中,c参数用于指定颜色,s参数用于指定点的大小。
原文地址: https://www.cveoy.top/t/topic/nhzL 著作权归作者所有。请勿转载和采集!