假设我们有一个包含n个样本的数据集,每个样本有m个特征。样本均值向量、样本协方差矩阵、样本相关系数矩阵及样本标准化矩阵的计算如下:/n/n1. 样本均值向量/n/n样本均值向量表示每个特征在数据集中的平均值。计算方法如下:/n/n$$/bar{x}=/frac{1}{n}/sum_{i=1}^{n}x_i$$ /n/n其中,$/bar{x}$是样本均值向量,$x_i$表示第$i$个样本。/n/n2. 样本协方差矩阵/n/n样本协方差矩阵表示不同特征之间的相关性。计算方法如下:/n/n$$S=/frac{1}{n-1}/sum_{i=1}^{n}(x_i-/bar{x})(x_i-/bar{x})^T$$ /n/n其中,$S$是样本协方差矩阵,$/bar{x}$是样本均值向量,$x_i$表示第$i$个样本。/n/n3. 样本相关系数矩阵/n/n样本相关系数矩阵表示不同特征之间的相关性,但是它消除了不同特征之间的量纲影响。计算方法如下:/n/n$$R=/frac{1}{n-1}/sum_{i=1}^{n}/frac{(x_i-/bar{x})}{/sigma_x}(/frac{(x_i-/bar{x})}{/sigma_x})^T$$ /n/n其中,$R$是样本相关系数矩阵,$/bar{x}$是样本均值向量,$x_i$表示第$i$个样本,$/sigma_x$表示样本标准差向量。/n/n4. 样本标准化矩阵/n/n样本标准化矩阵表示将每个特征标准化到均值为0,标准差为1的分布。计算方法如下:/n/n$$Z=/frac{x-/bar{x}}{/sigma_x}$$ /n/n其中,$Z$是样本标准化矩阵,$/bar{x}$是样本均值向量,$x$表示单个样本向量,$/sigma_x$表示样本标准差向量。

样本均值、协方差、相关系数和标准化矩阵计算详解

原文地址: https://www.cveoy.top/t/topic/oVkc 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录