Python读取Excel文档数据分类统计并绘制盒须图
Python读取Excel文档数据分类统计并绘制盒须图
本文将介绍使用Python读取Excel文档中某一列数据,并进行分类统计,最后绘制盒须图的简单方法。我们将使用pandas库读取Excel文档,使用value_counts()函数进行分类统计,并使用matplotlib库绘制盒须图。
代码示例
import pandas as pd
import matplotlib.pyplot as plt
# 使用pandas库读取Excel文档
df=pd.read_csv(r'D:\Echarts\Hollywood Movie Dataset\Most Profitable Hollywood Stories - US 2009.csv')
# 使用value_counts()函数对'Story'列数据进行分类并统计每类的数量
counts=df['Story'].value_counts()
# 显示数据统计结果
print(counts)
# 将统计结果转换为DataFrame格式
counts_df=pd.DataFrame(counts)
# 绘制盒须图
plt.boxplot(counts_df.values)
plt.show()
代码解释
- 导入库:导入pandas和matplotlib库,分别用于数据处理和绘图。
- 读取Excel文档:使用
pd.read_csv()函数读取Excel文档,并将数据存储在名为df的DataFrame中。 - 分类统计:使用
value_counts()函数对'Story'列数据进行分类统计,并将结果存储在名为counts的Series中。 - 显示统计结果:使用
print()函数输出counts的内容,显示每类数据的数量。 - 转换为DataFrame:将
counts转换为DataFrame格式,方便后续使用。 - 绘制盒须图:使用
plt.boxplot()函数绘制盒须图,并将counts_df.values作为数据源。 - 显示图表:使用
plt.show()函数显示绘制的盒须图。
总结
本文介绍了使用Python读取Excel文档中某一列数据,并进行分类统计,最后绘制盒须图的简单方法。通过pandas和matplotlib库,我们可以方便地完成数据处理和可视化操作。
原文地址: https://www.cveoy.top/t/topic/f0ad 著作权归作者所有。请勿转载和采集!