假设利用PCA得到的特征值分别为5和1对应的特征向量是1; 0和0;1;则对于数据集1 2 3; 4 5 6每行表示一个样本降到一维后的结果是?
首先,我们需要将数据集进行中心化处理,即每个样本减去其均值。均值为[2.5 3.5 4.5],中心化后的数据集为[-1.5 -1.5 -1.5; 0.5 1.5 2.5]。
然后,我们需要将数据集投影到特征向量上,得到新的一维数据。投影公式为:$y = \textbf{w}^T\textbf{x}$,其中$\textbf{w}$为特征向量,$\textbf{x}$为中心化后的样本。
对于第一个样本[-1.5 -1.5 -1.5],其投影值为$y_1 = [1, 0] \times [-1.5, -1.5, -1.5]^T = -1.5$。
对于第二个样本[0.5 1.5 2.5],其投影值为$y_2 = [1, 0] \times [0.5, 1.5, 2.5]^T = 0.5$。
因此,降到一维后的结果为[-1.5; 0.5]。
原文地址: https://www.cveoy.top/t/topic/eEkL 著作权归作者所有。请勿转载和采集!