假设我们有一个包含n个样本的数据集,每个样本有m个特征。样本均值向量、样本协方差矩阵、样本相关系数矩阵及样本标准化矩阵的计算如下:

  1. 样本均值向量

样本均值向量表示每个特征在数据集中的平均值。计算方法如下:

$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$

其中,$\bar{x}$是样本均值向量,$x_i$表示第$i$个样本。

  1. 样本协方差矩阵

样本协方差矩阵表示不同特征之间的相关性。计算方法如下:

$$S=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})(x_i-\bar{x})^T$$

其中,$S$是样本协方差矩阵,$\bar{x}$是样本均值向量,$x_i$表示第$i$个样本。

  1. 样本相关系数矩阵

样本相关系数矩阵表示不同特征之间的相关性,但是它消除了不同特征之间的量纲影响。计算方法如下:

$$R=\frac{1}{n-1}\sum_{i=1}^{n}\frac{(x_i-\bar{x})}{\sigma_x}(\frac{(x_i-\bar{x})}{\sigma_x})^T$$

其中,$R$是样本相关系数矩阵,$\bar{x}$是样本均值向量,$x_i$表示第$i$个样本,$\sigma_x$表示样本标准差向量。

  1. 样本标准化矩阵

样本标准化矩阵表示将每个特征标准化到均值为0,标准差为1的分布。计算方法如下:

$$Z=\frac{x-\bar{x}}{\sigma_x}$$

其中,$Z$是样本标准化矩阵,$\bar{x}$是样本均值向量,$x$表示单个样本向量,$\sigma_x$表示样本标准差向量

样本均值向量、样本协方差矩阵、样本相关系数矩阵及样本标准化矩阵计算

原文地址: https://www.cveoy.top/t/topic/hsuP 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录