6 假设利用PCA得到的特征值分别为5和1对应的特征向量是1; 0和0;1;则对于数据集1 2 3; 4 5 6每行表示一个样本降到一维后的结果是?
首先,我们需要对数据进行中心化处理,即将每个特征的平均值减去该特征所有样本的平均值。对于该数据集,每个特征的平均值分别为(2.5, 3.5, 4.5),中心化后的数据集为:
[-1.5, -1.5, -1.5; 1.5, 1.5, 1.5]
接下来,我们需要将数据投影到特征向量所张成的空间中。由于我们只需要将数据降到一维,所以我们只需要选取特征值最大的特征向量进行投影。在本例中,特征值最大的特征向量是[1; 0],所以我们将数据投影到该向量所张成的直线上。
具体地,我们可以将每个样本点与特征向量进行点乘,得到其在该向量上的投影值。对于第一个样本点[-1.5, -1.5, -1.5],其在[1; 0]上的投影值为-1.5;对于第二个样本点[1.5, 1.5, 1.5],其在[1; 0]上的投影值为1.5。因此,降到一维后的结果为:
[-1.5; 1.5]
原文地址: https://www.cveoy.top/t/topic/e9Cg 著作权归作者所有。请勿转载和采集!