Python读取Excel数据分类统计及PCA散点图绘制教程

本教程将演示如何使用Python读取Excel文档中的某一列数据，进行分类统计，并将统计结果可视化，最后使用PCA算法对数据进行降维并绘制散点图。

步骤一：安装所需库

首先，确保你已经安装了以下Python库：

pip install pandas numpy matplotlib sklearn

步骤二：读取Excel文件，获取指定列数据

import pandas as pd

# 读取Excel文件
data = pd.read_excel('data.xlsx')

# 获取指定列的数据
column_data = data['column_name']

将代码中的 'data.xlsx' 替换为你实际的Excel文件名，将 'column_name' 替换为你需要读取数据的列名。

步骤三：对数据进行分类统计

from collections import Counter

# 将数据进行分类统计
counter = Counter(column_data)

步骤四：显示统计数据

# 显示统计数据
for key, value in counter.items():
    print(key, value)

步骤五：使用PCA算法进行降维，并绘制散点图

import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# 将数据转换为numpy数组
column_array = np.array(column_data)

# 使用PCA进行降维
pca = PCA(n_components=2)
result = pca.fit_transform(column_array.reshape(-1, 1))

# 绘制散点图
plt.scatter(result[:, 0], result[:, 1])
plt.show()

完整代码：

import pandas as pd
from collections import Counter
import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# 读取Excel文件
data = pd.read_excel('data.xlsx')

# 获取指定列的数据
column_data = data['column_name']

# 将数据进行分类统计
counter = Counter(column_data)

# 显示统计数据
for key, value in counter.items():
    print(key, value)

# 将数据转换为numpy数组
column_array = np.array(column_data)

# 使用PCA进行降维
pca = PCA(n_components=2)
result = pca.fit_transform(column_array.reshape(-1, 1))

# 绘制散点图
plt.scatter(result[:, 0], result[:, 1])
plt.show()

这段代码将读取你的Excel文件，对指定列数据进行分类统计并打印结果，最后使用PCA算法降维并绘制散点图。你可以根据自己的需求修改文件名、列名以及代码的其他部分。