Python读取Excel数据分类统计及PCA散点图绘制教程
Python读取Excel数据分类统计及PCA散点图绘制教程
本教程将演示如何使用Python读取Excel文档中的某一列数据,进行分类统计,并将统计结果可视化,最后使用PCA算法对数据进行降维并绘制散点图。
步骤一:安装所需库
首先,确保你已经安装了以下Python库:
pip install pandas numpy matplotlib sklearn
步骤二:读取Excel文件,获取指定列数据
import pandas as pd
# 读取Excel文件
data = pd.read_excel('data.xlsx')
# 获取指定列的数据
column_data = data['column_name']
将代码中的 'data.xlsx' 替换为你实际的Excel文件名,将 'column_name' 替换为你需要读取数据的列名。
步骤三:对数据进行分类统计
from collections import Counter
# 将数据进行分类统计
counter = Counter(column_data)
步骤四:显示统计数据
# 显示统计数据
for key, value in counter.items():
print(key, value)
步骤五:使用PCA算法进行降维,并绘制散点图
import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
# 将数据转换为numpy数组
column_array = np.array(column_data)
# 使用PCA进行降维
pca = PCA(n_components=2)
result = pca.fit_transform(column_array.reshape(-1, 1))
# 绘制散点图
plt.scatter(result[:, 0], result[:, 1])
plt.show()
完整代码:
import pandas as pd
from collections import Counter
import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
# 读取Excel文件
data = pd.read_excel('data.xlsx')
# 获取指定列的数据
column_data = data['column_name']
# 将数据进行分类统计
counter = Counter(column_data)
# 显示统计数据
for key, value in counter.items():
print(key, value)
# 将数据转换为numpy数组
column_array = np.array(column_data)
# 使用PCA进行降维
pca = PCA(n_components=2)
result = pca.fit_transform(column_array.reshape(-1, 1))
# 绘制散点图
plt.scatter(result[:, 0], result[:, 1])
plt.show()
这段代码将读取你的Excel文件,对指定列数据进行分类统计并打印结果,最后使用PCA算法降维并绘制散点图。你可以根据自己的需求修改文件名、列名以及代码的其他部分。
原文地址: https://www.cveoy.top/t/topic/f0aQ 著作权归作者所有。请勿转载和采集!