使用 Python 对 Excel 文档数据进行分类统计并生成交互式散点图

本文将演示如何使用 Python 代码对 Excel 文档中某一列数据进行分类,统计每类数量,并生成包含交互功能的散点图,直观展示数据分布和类别信息。

代码示例:

import pandas as pd
import plotly.express as px

# 读取 Excel 文件
df = pd.read_excel('data.xlsx')

# 对某一列数据进行分类,统计每类的数量
counts = df['Category'].value_counts()

# 显示数据统计结果
print(counts)

# 生成散点图
fig = px.scatter(df, x='X', y='Y', color='Category')

# 添加交互
fig.update_layout(
    clickmode='event+select'
)

# 显示图形
fig.show()

代码说明:

  1. 读取 Excel 文件: 使用 pandas 库中的 read_excel() 函数读取 Excel 文件,并将其存储在 df 数据框中。
  2. 分类统计: 使用 value_counts() 函数统计 Category 列中每个类别的数量,并将其存储在 counts 变量中。
  3. 显示统计结果: 使用 print() 函数打印 counts 变量,显示每个类别的数量。
  4. 生成散点图: 使用 plotly.express 库中的 scatter() 函数生成散点图。xycolor 参数分别指定数据框中的 XYCategory 列,将数据按照类别颜色区分。
  5. 添加交互: 使用 update_layout() 函数添加交互功能,允许用户通过点击选择数据点。clickmode='event+select' 选项启用事件选择模式,允许用户选择单个数据点或多个数据点。
  6. 显示图形: 使用 show() 函数显示生成的散点图。

注意:

  • 假设 Excel 文件中包含两列数据,分别为 XY,还有一列数据为 Category,表示数据的类别。
  • 您可以根据实际情况修改代码中的文件名、列名和交互选项。

通过以上代码,您可以轻松地对 Excel 文档数据进行分类统计并生成交互式散点图,从而更加直观地理解数据分布和类别信息。

Python Excel 数据分类统计与交互式散点图

原文地址: https://www.cveoy.top/t/topic/fZ0I 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录