Python读取Excel数据并统计可视化:分类统计与盒须图绘制

本文将介绍如何使用Python读取Excel文件特定列数据,对其进行分类统计,并利用Matplotlib库绘制盒须图,直观地展示数据分布情况。

代码示例:

import pandas as pd
import matplotlib.pyplot as plt

# 读取Excel文档
df = pd.read_excel('example.xlsx', usecols=[0])

# 对数据进行分类和统计
counts = df.groupby(df.columns[0]).size()

# 绘制盒须图
plt.boxplot(df.values)
plt.title('第一列数据的盒须图')
plt.show()

# 输出分类统计结果
print(counts)

代码解释:

  1. 导入库: 首先导入pandas库用于读取Excel数据,导入matplotlib.pyplot库用于数据可视化。
  2. 读取数据: 使用pandas库中的read_excel函数读取Excel文件'example.xlsx',usecols=[0]参数指定只读取第一列数据。
  3. 分类统计: 使用groupby函数对第一列数据进行分类,并使用size函数统计每个分类的数量。
  4. 绘制盒须图: 使用matplotlib.pyplot库中的boxplot函数绘制盒须图,df.valuesDataFrame对象转换为numpy数组。
  5. 设置标题: 使用title函数设置图表标题为'第一列数据的盒须图'。
  6. 显示图表: 使用show函数显示图表。
  7. 输出结果: 打印分类统计的结果。

总结:

通过以上代码,我们可以方便地读取Excel文件特定列数据,进行分类统计并绘制盒须图,从而更直观地了解数据的分布情况。该方法可以应用于各种数据分析场景,例如分析用户年龄分布、商品销量统计等。

Python读取Excel数据并统计可视化:分类统计与盒须图绘制

原文地址: https://www.cveoy.top/t/topic/fZ9b 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录