假设有 n 个观测值,每个观测值有 m 个变量。样本均值向量、样本协方差矩阵、样本相关系数矩阵和样本标准化矩阵的计算如下:/n/n样本均值向量/n/n样本均值向量是每个变量的平均值构成的向量,即/n/n$$/bar{//mathbf{x}} = //frac{1}{n} //sum_{i=1}^n //mathbf{x}_i$$ /n/n其中,$//mathbf{x}i$ 是第 $i$ 个观测值的 $m$ 个变量的取值构成的向量。/n/n样本协方差矩阵/n/n样本协方差矩阵是各变量之间的协方差构成的矩阵,即/n/n$$/mathbf{S} = //frac{1}{n-1} //sum{i=1}^n (//mathbf{x}i - //bar{//mathbf{x}})(//mathbf{x}i - //bar{//mathbf{x}})^T$$ /n/n其中,$//mathbf{x}i$ 是第 $i$ 个观测值的 $m$ 个变量的取值构成的向量,$//bar{//mathbf{x}}$ 是样本均值向量。/n/n样本相关系数矩阵/n/n样本相关系数矩阵是各变量之间的相关系数构成的矩阵,即/n/n$$/mathbf{R} = (//mathbf{D}^{-1/2}) //mathbf{S} (//mathbf{D}^{-1/2})$$ /n/n其中,$//mathbf{S}$ 是样本协方差矩阵,$//mathbf{D}$ 是对角矩阵,其对角线元素为方差的倒数,即/n/n$$/mathbf{D}{ii} = //frac{1}{s{ii}}$$ /n/n其中,$s{ii}$ 是第 $i$ 个变量的样本方差。/n/n样本标准化矩阵/n/n样本标准化矩阵是每个变量减去均值后除以标准差构成的矩阵,即/n/n$$/mathbf{Z} = //frac{//mathbf{X} - //mathbf{1}//bar{//mathbf{x}}}{//mathbf{1}^T //mathbf{D}^{-1/2} //mathbf{1}}$$ /n/n其中,$//mathbf{X}$ 是 $n //times m$ 的矩阵,其每行对应一个观测值,$//mathbf{1}$ 是 $n //times 1$ 的列向量,其每个元素均为 1,$//bar{//mathbf{x}}$ 和 $//mathbf{D}$ 分别为样本均值向量和对角矩阵,其对角线元素为方差的倒数。


原文地址: https://www.cveoy.top/t/topic/oVkg 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录