12.最后,本项目使用 Seaborn 库中的 lmplot() 函数绘制了降维后的数据集中的每个样本在主成分空间中的分布情况,其中,x 轴表示第一个主成分,y 轴表示第二个主成分,hue 参数表示按照原始数据集中的 'Risk' 列进行分类,即将数据集按照风险等级分为三类,分别用不同的颜色进行标识。通过这一步操作,本项目可以更加直观地观察数据集中不同样本之间的相似性和差异性,以及不同风险等级之间的关系和区别。如图4.7所示,图形中不同颜色的点表示不同风险等级的样本,可以看出不同风险等级之间的分布情况和差异性,以及每个主成分对数据的解释能力和重要性。


原文地址: https://www.cveoy.top/t/topic/e8Xw 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录