Python读取Excel数据分类统计及PCA散点图绘制教程

本教程将演示如何使用Python读取Excel文档中的某一列数据,进行分类统计,并将统计结果可视化,最后使用PCA算法对数据进行降维并绘制散点图。

步骤一:安装所需库

首先,确保你已经安装了以下Python库:

pip install pandas numpy matplotlib sklearn

步骤二:读取Excel文件,获取指定列数据

import pandas as pd

# 读取Excel文件
data = pd.read_excel('data.xlsx')

# 获取指定列的数据
column_data = data['column_name']

将代码中的 'data.xlsx' 替换为你实际的Excel文件名,将 'column_name' 替换为你需要读取数据的列名。

步骤三:对数据进行分类统计

from collections import Counter

# 将数据进行分类统计
counter = Counter(column_data)

步骤四:显示统计数据

# 显示统计数据
for key, value in counter.items():
    print(key, value)

步骤五:使用PCA算法进行降维,并绘制散点图

import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# 将数据转换为numpy数组
column_array = np.array(column_data)

# 使用PCA进行降维
pca = PCA(n_components=2)
result = pca.fit_transform(column_array.reshape(-1, 1))

# 绘制散点图
plt.scatter(result[:, 0], result[:, 1])
plt.show()

完整代码:

import pandas as pd
from collections import Counter
import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# 读取Excel文件
data = pd.read_excel('data.xlsx')

# 获取指定列的数据
column_data = data['column_name']

# 将数据进行分类统计
counter = Counter(column_data)

# 显示统计数据
for key, value in counter.items():
    print(key, value)

# 将数据转换为numpy数组
column_array = np.array(column_data)

# 使用PCA进行降维
pca = PCA(n_components=2)
result = pca.fit_transform(column_array.reshape(-1, 1))

# 绘制散点图
plt.scatter(result[:, 0], result[:, 1])
plt.show()

这段代码将读取你的Excel文件,对指定列数据进行分类统计并打印结果,最后使用PCA算法降维并绘制散点图。你可以根据自己的需求修改文件名、列名以及代码的其他部分。

Python读取Excel数据分类统计及PCA散点图绘制教程

原文地址: https://www.cveoy.top/t/topic/f0aQ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录