Iris 数据集的聚类分析:不同变量组合的树状图比较
本文使用 R 语言对 Iris 数据集进行聚类分析,并比较了使用不同变量组合进行聚类分析得到的树状图。
代码如下:
hc5 <- hclust(dist(iris_new[,1:2])) hc6 <- hclust(dist(iris_new[,1:3])) hc7 <- hclust(dist(iris_new[,1:4])) hc8 <- hclust(dist(iris_new[,2:3])) hc9 <- hclust(dist(iris_new[,2:4])) hc10 <- hclust(dist(iris_new[,3:4])) plot(hc5) plot(hc6) plot(hc7) plot(hc8) plot(hc9) plot(hc10)
其中,hc5 表示使用前两个变量('Sepal.Length' 和 'Sepal.Width')进行聚类分析,hc6 表示使用前三个变量('Sepal.Length'、'Sepal.Width' 和 'Petal.Length')进行聚类分析,hc7 表示使用全部四个变量进行聚类分析,hc8 表示使用第二个和第三个变量('Sepal.Width' 和 'Petal.Length')进行聚类分析,hc9 表示使用第二个、第三个和第四个变量('Sepal.Width'、'Petal.Length' 和 'Petal.Width')进行聚类分析,hc10 表示使用第三个和第四个变量('Petal.Length' 和 'Petal.Width')进行聚类分析。
每张图都是聚类分析的树状图,可以用来观察样本间的相似度和聚类情况。通过比较不同变量组合的树状图,我们可以了解不同变量对聚类结果的影响,并选择最合适的变量组合进行聚类分析。
原文地址: https://www.cveoy.top/t/topic/oyPA 著作权归作者所有。请勿转载和采集!