Iris 数据集的聚类分析：不同变量组合的树状图比较

本文使用 R 语言对 Iris 数据集进行聚类分析，并比较了使用不同变量组合进行聚类分析得到的树状图。

代码如下：

hc5 <- hclust(dist(iris_new[,1:2])) hc6 <- hclust(dist(iris_new[,1:3])) hc7 <- hclust(dist(iris_new[,1:4])) hc8 <- hclust(dist(iris_new[,2:3])) hc9 <- hclust(dist(iris_new[,2:4])) hc10 <- hclust(dist(iris_new[,3:4])) plot(hc5) plot(hc6) plot(hc7) plot(hc8) plot(hc9) plot(hc10)

其中，hc5 表示使用前两个变量（'Sepal.Length' 和 'Sepal.Width'）进行聚类分析，hc6 表示使用前三个变量（'Sepal.Length'、'Sepal.Width' 和 'Petal.Length'）进行聚类分析，hc7 表示使用全部四个变量进行聚类分析，hc8 表示使用第二个和第三个变量（'Sepal.Width' 和 'Petal.Length'）进行聚类分析，hc9 表示使用第二个、第三个和第四个变量（'Sepal.Width'、'Petal.Length' 和 'Petal.Width'）进行聚类分析，hc10 表示使用第三个和第四个变量（'Petal.Length' 和 'Petal.Width'）进行聚类分析。

每张图都是聚类分析的树状图，可以用来观察样本间的相似度和聚类情况。通过比较不同变量组合的树状图，我们可以了解不同变量对聚类结果的影响，并选择最合适的变量组合进行聚类分析。