Python Excel数据分类统计及可视化：使用pandas和matplotlib

使用Python对Excel数据进行分类统计并生成柱状图

本教程将演示如何使用Python的pandas和matplotlib库对Excel文档中某一列数据进行分类统计，并将统计结果以清晰的柱状图形式展示出来。

1. 数据读取和分类统计

首先，我们需要使用pandas库读取Excel文件并对指定列进行分类统计。

import pandas as pd

# 读取Excel文件
data = pd.read_excel('data.xlsx')

# 指定需要分类的列名
column = '分类列名称'

# 使用groupby进行分类统计
result = data.groupby(column).size()
print(result)

这段代码将读取名为'data.xlsx'的Excel文件，并对名为'分类列名称'的列进行分类统计，最终打印出每个类别的数量。

2. 数据可视化

接下来，我们将使用matplotlib库将统计结果绘制成柱状图。

import matplotlib.pyplot as plt

# 绘制柱状图
plt.bar(result.index, result.values)

# 设置图表标题和坐标轴标签
plt.title('数据统计结果')
plt.xlabel(column)
plt.ylabel('数量')

# 显示图表
plt.show()

这段代码将根据分类结果绘制柱状图，并设置相应的图表标题和坐标轴标签。

完整代码

import pandas as pd
import matplotlib.pyplot as plt

# 读取Excel文件
data = pd.read_excel('data.xlsx')

# 指定需要分类的列名
column = '分类列名称'

# 使用groupby进行分类统计
result = data.groupby(column).size()
print(result)

# 绘制柱状图
plt.bar(result.index, result.values)

# 设置图表标题和坐标轴标签
plt.title('数据统计结果')
plt.xlabel(column)
plt.ylabel('数量')

# 显示图表
plt.show()

注意事项:

请确保将'data.xlsx'替换为实际的文件名，并将'分类列名称'替换为实际的列名。
需要将Excel文件放在与Python脚本相同的目录下，或者使用文件的绝对路径。

希望本教程能够帮助您使用Python轻松地对Excel数据进行分类统计并进行可视化展示！