决策树模型:基于'有无支票账户'特征的样本划分及基尼系数计算
首先,计算总体基尼系数:
总体基尼系数 = 1 - (15/25)^2 - (10/25)^2 ≈ 0.48
然后,计算按'有无支票账户'划分后的基尼系数:
'无支票账户'子集基尼系数 = 1 - (8/10)^2 - (2/10)^2 ≈ 0.32
'有支票账户'子集基尼系数 = 1 - (2/15)^2 - (13/15)^2 ≈ 0.37
按'有无支票账户'划分后的基尼系数 = (10/25) * 0.32 + (15/25) * 0.37 ≈ 0.35
因此,按'有无支票账户'划分后的数据集的总基尼系数为0.35。
原文地址: https://www.cveoy.top/t/topic/odC5 著作权归作者所有。请勿转载和采集!