使用python编写无监督聚类算法对基因进行聚类并且满足以下要求:1读入Excel表格第头行为基因名称其余各行为基因表达量路径为:CUserslenovoDesktopHIVDNN神经网络测试output_data1xlsx
2.实现K-means聚类算法,其中K=3 3.将聚类结果输出到Excel表格中,第一列为基因名称,第二列为基因表达量,第三列为所属聚类编号,路径为:C:\Users\lenovo\Desktop\HIV\DNN神经网络测试\output_data2.xlsx
代码如下:
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
# 读取Excel表格
data = pd.read_excel('C:\\Users\\lenovo\\Desktop\\HIV\\DNN神经网络测试\\output_data1.xlsx', index_col=0)
# K-means聚类
kmeans = KMeans(n_clusters=3, random_state=0).fit(data)
labels = kmeans.predict(data)
# 将聚类结果输出到Excel表格中
output_data = pd.DataFrame({'gene_name': data.index, 'gene_expression': data.values.ravel(), 'cluster_label': labels})
output_data.to_excel('C:\\Users\\lenovo\\Desktop\\HIV\\DNN神经网络测试\\output_data2.xlsx', index=False)
原文地址: https://www.cveoy.top/t/topic/bPvV 著作权归作者所有。请勿转载和采集!