Python读取Excel数据并统计可视化:分类统计与盒须图绘制
Python读取Excel数据并统计可视化:分类统计与盒须图绘制
本文将介绍如何使用Python读取Excel文件特定列数据,对其进行分类统计,并利用Matplotlib库绘制盒须图,直观地展示数据分布情况。
代码示例:
import pandas as pd
import matplotlib.pyplot as plt
# 读取Excel文档
df = pd.read_excel('example.xlsx', usecols=[0])
# 对数据进行分类和统计
counts = df.groupby(df.columns[0]).size()
# 绘制盒须图
plt.boxplot(df.values)
plt.title('第一列数据的盒须图')
plt.show()
# 输出分类统计结果
print(counts)
代码解释:
- 导入库: 首先导入
pandas库用于读取Excel数据,导入matplotlib.pyplot库用于数据可视化。 - 读取数据: 使用
pandas库中的read_excel函数读取Excel文件'example.xlsx',usecols=[0]参数指定只读取第一列数据。 - 分类统计: 使用
groupby函数对第一列数据进行分类,并使用size函数统计每个分类的数量。 - 绘制盒须图: 使用
matplotlib.pyplot库中的boxplot函数绘制盒须图,df.values将DataFrame对象转换为numpy数组。 - 设置标题: 使用
title函数设置图表标题为'第一列数据的盒须图'。 - 显示图表: 使用
show函数显示图表。 - 输出结果: 打印分类统计的结果。
总结:
通过以上代码,我们可以方便地读取Excel文件特定列数据,进行分类统计并绘制盒须图,从而更直观地了解数据的分布情况。该方法可以应用于各种数据分析场景,例如分析用户年龄分布、商品销量统计等。
原文地址: https://www.cveoy.top/t/topic/fZ9b 著作权归作者所有。请勿转载和采集!