首先,计算总体基尼系数:

总体基尼系数 = 1 - (15/25)^2 - (10/25)^2 ≈ 0.48

然后,计算按“有无支票账户”划分后的基尼系数:

“无支票账户”子集基尼系数 = 1 - (8/10)^2 - (2/10)^2 ≈ 0.32

“有支票账户”子集基尼系数 = 1 - (2/15)^2 - (13/15)^2 ≈ 0.37

按“有无支票账户”划分后的基尼系数 = (10/25) * 0.32 + (15/25) * 0.37 ≈ 0.35

因此,按“有无支票账户”划分后的数据集的总基尼系数为0.35。

对于一个贷款申请客户数据集共有25个样本数据集包含有无支票账户和当前欠款总额两个特征样本的目标标签为高风险或低风险。现准备构造决策树模型利用有无支票账户这个特征为当前节点来对数据集进行划分划分结果如下表:无支票账户有支票账户高风险82低风险213求按有无支票账户划分之后的数据集的总基尼系数要求写出计算过程。

原文地址: https://www.cveoy.top/t/topic/fnK3 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录