rowsum = nparrayfeaturessum1 r_inv = nppowerrowsum -1flatten r_invnpisinfr_inv = 0 r_mat_inv = spdiagsr_inv features = r_mat_invdotfeatures解释上面代码
这段代码的作用是对特征矩阵进行标准化处理,具体步骤如下:
1.计算每个样本的特征值之和,得到一个长度为样本数的一维数组rowsum,即行求和。
2.将rowsum数组中的每个元素取其倒数,得到一个长度为样本数的一维数组r_inv,即对每个元素取倒数。
3.将r_inv数组中的无穷大元素(即原特征矩阵中某些行的特征值之和为0)置为0。
4.将r_inv数组转化为对角线矩阵r_mat_inv。
5.将原特征矩阵features左乘r_mat_inv矩阵,得到标准化后的特征矩阵。这一步的目的是将每个样本的特征值除以其特征值之和,从而得到该样本在所有特征上的相对权重。
原文地址: https://www.cveoy.top/t/topic/bAt9 著作权归作者所有。请勿转载和采集!