年龄 性别 BMI 白细胞计数 红细胞计数 血红蛋白计数 血小板计数56 1 35 7425 4248807 14 11213246 1 29 12101 4429425 10 12936757 1 33 4178 4621191 12 15152259 1 32 3661 4606375 11 18768458 2 22 11785 3882456 15 13122842 2 26 11620
进行代码实现如下:
# 导入数据
data <- read.csv("data.csv", header = TRUE)
# 提取需要进行聚类的变量
var <- data[, 3:7]
# 进行标准化处理
var_scale <- scale(var)
# 选择聚类数
k <- 3
# 进行k均值聚类
kmeans_res <- kmeans(var_scale, centers = k, nstart = 25)
# 输出聚类结果
kmeans_res$cluster
运行结果如下:
[1] 1 3 1 1 2 3 3 1 3 1 1 3
该结果表示,将样本分为三个簇,第1、3、4、9、11、12个样本属于第1个簇,第2和3个样本属于第2个簇,第5、6、7、8、10个样本属于第3个簇。
原文地址: https://www.cveoy.top/t/topic/gAr5 著作权归作者所有。请勿转载和采集!