熵权法怎么标准化数据
熵权法是一种多指标决策方法,可以用于标准化数据。具体步骤如下:
-
将原始数据进行归一化处理,将各指标的取值范围都缩放到0~1之间。
-
对于每个指标,计算其熵值。熵值反映了该指标的信息量,越高表示该指标对决策的影响越大。
-
计算每个指标的权重,即熵值占所有指标熵值之和的比例。
-
对每个指标的归一化得分进行加权求和,得到最终权重的综合得分。
-
对综合得分进行归一化处理,将其范围缩放到0~1之间。
具体公式如下:
-
归一化处理:$x'{ij}=\frac{x{ij}-min(x_j)}{max(x_j)-min(x_j)}$
-
计算熵值:$E_j=-\sum_{i=1}^{n}\frac{x'{ij}}{ln(n)}ln\frac{x'{ij}}{ln(n)}$
-
计算权重:$w_j=\frac{1-E_j}{\sum_{k=1}^{m}(1-E_k)}$
-
加权求和:$S_i=\sum_{j=1}^{m}w_jx'_{ij}$
-
归一化处理:$S'_i=\frac{S_i-min(S)}{max(S)-min(S)}$
其中,$n$为样本个数,$m$为指标个数,$x_{ij}$为第$i$个样本的第$j$个指标原始值,$x'_{ij}$为第$i$个样本的第$j$个指标归一化得分,$E_j$为第$j$个指标的熵值,$w_j$为第$j$个指标的权重,$S_i$为第$i$个样本的综合得分,$S'_i$为第$i$个样本的标准化综合得分
原文地址: https://www.cveoy.top/t/topic/dEF4 著作权归作者所有。请勿转载和采集!