K-Means 聚类分析:鸢尾花数据集变量组合比较
K-Means 聚类分析:鸢尾花数据集变量组合比较
本示例代码使用 K-Means 聚类算法对鸢尾花数据集的不同变量组合进行分析,并输出聚类结果和聚类簇与鸢尾花种类的交叉表。
# 使用前两个变量进行聚类
kmeans_fit5 <- kmeans(iris_new[,1:2], centers = 3)
kmeans_fit5
table(kmeans_fit5$cluster, iris$Species)
# 使用前三个变量进行聚类
kmeans_fit6 <- kmeans(iris_new[,1:3], centers = 3)
kmeans_fit6
table(kmeans_fit6$cluster, iris$Species)
# 使用前四个变量进行聚类
kmeans_fit7 <- kmeans(iris_new[,1:4], centers = 3)
kmeans_fit7
table(kmeans_fit7$cluster, iris$Species)
# 使用第二个和第三个变量进行聚类
kmeans_fit8 <- kmeans(iris_new[,2:3], centers = 3)
kmeans_fit8
table(kmeans_fit8$cluster, iris$Species)
# 使用第二个、第三个和第四个变量进行聚类
kmeans_fit9 <- kmeans(iris_new[,2:4], centers = 3)
kmeans_fit9
table(kmeans_fit9$cluster, iris$Species)
# 使用第三个和第四个变量进行聚类
kmeans_fit10 <- kmeans(iris_new[,3:4], centers = 3)
kmeans_fit10
table(kmeans_fit10$cluster, iris$Species)
代码说明:
iris_new是从鸢尾花数据集 (iris) 中选取的一部分变量。kmeans()函数执行 K-Means 聚类,centers = 3指定了要创建的聚类簇数量。table()函数生成聚类簇与鸢尾花种类的交叉表,方便观察聚类结果。
通过比较不同变量组合的聚类结果,可以了解不同变量对聚类结果的影响,并选择最适合的变量组合进行聚类分析。
原文地址: https://www.cveoy.top/t/topic/oyP7 著作权归作者所有。请勿转载和采集!