样本均值向量、样本协方差矩阵、样本相关系数矩阵及样本标准化矩阵计算
假设我们有一个包含n个样本的数据集,每个样本有m个特征。样本均值向量、样本协方差矩阵、样本相关系数矩阵及样本标准化矩阵的计算如下:
- 样本均值向量
样本均值向量表示每个特征在数据集中的平均值。计算方法如下:
$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$
其中,$\bar{x}$是样本均值向量,$x_i$表示第$i$个样本。
- 样本协方差矩阵
样本协方差矩阵表示不同特征之间的相关性。计算方法如下:
$$S=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})(x_i-\bar{x})^T$$
其中,$S$是样本协方差矩阵,$\bar{x}$是样本均值向量,$x_i$表示第$i$个样本。
- 样本相关系数矩阵
样本相关系数矩阵表示不同特征之间的相关性,但是它消除了不同特征之间的量纲影响。计算方法如下:
$$R=\frac{1}{n-1}\sum_{i=1}^{n}\frac{(x_i-\bar{x})}{\sigma_x}(\frac{(x_i-\bar{x})}{\sigma_x})^T$$
其中,$R$是样本相关系数矩阵,$\bar{x}$是样本均值向量,$x_i$表示第$i$个样本,$\sigma_x$表示样本标准差向量。
- 样本标准化矩阵
样本标准化矩阵表示将每个特征标准化到均值为0,标准差为1的分布。计算方法如下:
$$Z=\frac{x-\bar{x}}{\sigma_x}$$
其中,$Z$是样本标准化矩阵,$\bar{x}$是样本均值向量,$x$表示单个样本向量,$\sigma_x$表示样本标准差向量
原文地址: https://www.cveoy.top/t/topic/hsuP 著作权归作者所有。请勿转载和采集!