首先,我们需要对数据进行中心化处理,即将每个特征的平均值减去该特征所有样本的平均值。对于该数据集,每个特征的平均值分别为 (2.5, 3.5, 4.5),中心化后的数据集为:

[-1.5, -1.5, -1.5; 1.5, 1.5, 1.5]

接下来,我们需要将数据投影到特征向量所张成的空间中。由于我们只需要将数据降到一维,所以我们只需要选取特征值最大的特征向量进行投影。在本例中,特征值最大的特征向量是[1; 0],所以我们将数据投影到该向量所张成的直线上。

具体地,我们可以将每个样本点与特征向量进行点乘,得到其在该向量上的投影值。对于第一个样本点[-1.5, -1.5, -1.5],其在[1; 0]上的投影值为-1.5;对于第二个样本点[1.5, 1.5, 1.5],其在[1; 0]上的投影值为1.5。因此,降到一维后的结果为:

[-1.5; 1.5]

PCA 降维实例:将二维数据降至一维

原文地址: https://www.cveoy.top/t/topic/n2zj 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录