R语言K-Means聚类分析:航空客户价值分析
R语言K-Means聚类分析:航空客户价值分析
本实验将使用R语言的K-Means函数对航空客户数据进行聚类分析,帮助您掌握聚类分析建模的完整过程。我们将从数据预处理开始,构建K-Means聚类模型,并可视化聚类结果。此外,我们将对模型进行优化,并与PAM函数的聚类结果进行对比。
实验目的
- 掌握R语言中使用K-Means函数进行聚类分析建模的过程。
实验内容
- 依据kmeans()函数的使用方法,对航空客户数据进行聚类价值分析,数据文件为'aircustomers_data.csv'。
- 对数据集进行预处理,消除量纲差别。
- 对预处理后的数据集进行K-Means聚类,查看聚类结果,并绘制图形。
- 对聚类模型进行优化调优。
实验方法与步骤
- 导入实验数据'aircustomers_data.csv'。
- 对数据集进行中心标准化。
- 使用kmeans()函数进行聚类分析建模,聚类数设置为5类。
- 使用print()函数查看聚类结果,并绘制图形。
- 调整聚类数k,对模型进行优化调优。
- 使用pam()函数对数据集进行聚类分析建模,与kmeans()函数的聚类结果进行对比。
R语言实验代码
# Step 1: 导入实验数据
aircustomers_data <- read.csv('aircustomers_data.csv')
head(aircustomers_data)
# Step 2: 对数据集进行中心标准化
aircustomers_data_scaled <- scale(aircustomers_data)
# Step 3: 使用kmeans()函数进行聚类分析建模,聚类数设置为5类
kmeans_model <- kmeans(aircustomers_data_scaled, centers = 5)
# Step 4: 使用print()函数查看聚类结果,并绘制图形
print(kmeans_model)
plot(aircustomers_data_scaled, col = kmeans_model$cluster, main = 'K-Means Clustering of Air Customers Data')
# Step 5: 调整聚类数k,对模型进行优化调优
wss <- (nrow(aircustomers_data_scaled)-1)*sum(apply(aircustomers_data_scaled, 2, var))
for (i in 2:10) {
kmeans_model <- kmeans(aircustomers_data_scaled, centers = i)
wss[i] <- kmeans_model$tot.withinss
}
plot(1:10, wss, type = 'b', xlab = 'Number of Clusters', ylab = 'Within-cluster Sum of Squares')
# Step 6: 使用pam()函数对数据集进行聚类分析建模,与kmeans()函数的聚类结果进行对比
library(cluster)
pam_model <- pam(aircustomers_data_scaled, diss = TRUE, k = 5)
print(pam_model)
plot(aircustomers_data_scaled, col = pam_model$clustering, main = 'PAM Clustering of Air Customers Data')
通过本实验,您将掌握使用R语言进行K-Means聚类分析的具体步骤,并了解如何对聚类模型进行优化和评估。祝您实验顺利!
原文地址: https://www.cveoy.top/t/topic/oX7n 著作权归作者所有。请勿转载和采集!