Python数据分析:读取Excel两列数据,分类统计并绘制盒须图
Python数据分析:读取Excel两列数据,分类统计并绘制盒须图
本文介绍如何使用Python读取Excel文档中的两列数据,分别对它们进行分类统计,并将结果可视化为盒须图。
import pandas as pd
import matplotlib.pyplot as plt
# 读取excel文档
df = pd.read_excel('data.xlsx')
# 分别提取两列数据
col1 = df['Column1']
col2 = df['Column2']
# 对第一列数据进行分类和统计
col1_counts = col1.value_counts()
# 对第二列数据进行分类和统计
col2_counts = col2.value_counts()
# 显示统计数据
print('Column1:')
print(col1_counts)
print('Column2:')
print(col2_counts)
# 绘制盒须图
plt.boxplot([col1, col2])
plt.xticks([1, 2], ['Column1', 'Column2'])
plt.show()
代码解析:
- 导入库: 导入
pandas库用于数据处理,matplotlib.pyplot库用于数据可视化。 - 读取数据: 使用
pd.read_excel()函数读取名为'data.xlsx'的Excel文件。 - 提取数据: 使用列名'Column1'和'Column2'分别提取两列数据。
- 分类统计: 使用
value_counts()方法分别对两列数据进行分类统计,得到每个唯一值的出现次数。 - 显示统计结果: 使用
print()函数打印两列数据的分类统计结果。 - 绘制盒须图: 使用
plt.boxplot()函数绘制盒须图,传入一个包含两列数据的列表。 - 设置x轴刻度: 使用
plt.xticks()函数设置x轴刻度,使其对应两列数据的名称。 - 显示图表: 使用
plt.show()函数显示绘制的盒须图。
数据说明:
data.xlsx:包含两列数据的Excel文档。Column1和Column2:两列数据的列名。
这段代码展示了如何使用Python进行简单的数据分析和可视化。您可以根据自己的数据和需求修改代码,例如更改文件名、列名、图表类型等。
原文地址: https://www.cveoy.top/t/topic/f0ak 著作权归作者所有。请勿转载和采集!