Python读取Excel列数据:分类统计与盒须图绘制

本文提供一个简单的Python代码示例,用于读取Excel文档中指定列的数据,对其进行分类统计,并使用盒须图将结果可视化。

import pandas as pd
import matplotlib.pyplot as plt

# 读取Excel文件
df = pd.read_excel('data.xlsx')

# 选择某一列数据进行分类和统计
data = df['column_name'].value_counts()

# 显示统计数据
print(data)

# 绘制盒须图
plt.boxplot(df['column_name'])
plt.show()

代码解释:

  1. 导入必要的库:
    • pandas 用于数据处理和读取Excel文件。
    • matplotlib.pyplot 用于绘制图表。
  2. 读取Excel文件:
    • 使用 pd.read_excel('data.xlsx') 读取名为 'data.xlsx' 的Excel文件,并将其存储在名为 df 的DataFrame中。
  3. 选择数据列:
    • 使用 df['column_name'] 选择名为 'column_name' 的列进行分析。
  4. 数据分类统计:
    • 使用 value_counts() 函数对选定列的数据进行计数,返回一个Series,其中包含每个唯一值的出现次数。
  5. 显示统计数据:
    • 使用 print(data) 将统计结果输出到控制台。
  6. 绘制盒须图:
    • 使用 plt.boxplot(df['column_name']) 根据选定列的数据绘制盒须图。
    • 使用 plt.show() 显示生成的图表。

请注意:

  • 将 'data.xlsx' 替换为您要读取的Excel文件名。
  • 将 'column_name' 替换为您要分析的列名。

这段代码简洁易懂,适合初学者学习如何使用Python进行数据分析和可视化。通过修改文件名和列名,您可以轻松地将其应用于自己的数据集。

Python读取Excel列数据:分类统计与盒须图绘制

原文地址: https://www.cveoy.top/t/topic/fZ9Y 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录