Python决策树算法实现与可视化

import numpy as np

def create_decision_tree(feat_matrix, labels, feat_names, method='ID3'):
    # 决策树构建函数
    # 参数:
    #     feat_matrix: 特征矩阵
    #     labels: 标签列表
    #     feat_names: 特征名称列表
    #     method: 决策树构建方法，默认为'ID3'

    # 终止条件1: 类别标签只有一种类型
    if len(set(labels)) == 1:
        return labels[0]  # 返回该标签

    # 终止条件2: 特征没有其他取值
    if feat_matrix.shape[0] == 0:
        return get_max_label(labels)  # 返回出现次数最多的标签

    # 选择信息增益最大的特征
    best_feat, sign = get_best_feat(feat_matrix, labels)
    best_feat_name = feat_names[best_feat]

    # 初始化决策树
    decision_tree = {best_feat_name: {}}

    # 如果是离散特征，则删除该特征
    if sign == 'discrete':
        feat_names = np.delete(feat_names, best_feat)

    # 得到子集
    feat_matrixset, labelsset = get_subset(feat_matrix, labels, best_feat, sign)

    # 递归构造子树
    for value in feat_matrixset.keys():
        decision_tree[best_feat_name][value] = create_decision_tree(
            feat_matrixset[value], labelsset[value], feat_names, method
        )

    return decision_tree


if __name__ == '__main__':
    # 获取数据
    feat_matrix, labels, feat_names = get_data()

    # 创建决策树
    decision_tree = create_decision_tree(feat_matrix, labels, feat_names, method='ID3')

    # 打印决策树
    print(decision_tree)

    # 可视化决策树
    createPlot(decision_tree)

这段代码实现了一个决策树构建函数 create_decision_tree，并展示了如何使用该函数构建决策树并进行可视化。

代码说明：

create_decision_tree 函数：
- 接受特征矩阵、标签列表、特征名称列表和决策树构建方法作为参数。
- 使用递归的方式构建决策树。
- 包含两个终止条件：标签唯一和特征取值为空。
- 使用信息增益选择最佳特征。
- 根据特征类型进行不同的处理。
if __name__ == '__main__': 部分：
- 调用 get_data 函数获取数据。
- 调用 create_decision_tree 函数构建决策树。
- 打印生成的决策树。
- 调用 createPlot 函数可视化决策树。

注意：

代码中使用的 get_data、get_best_feat、get_subset、get_max_label 和 createPlot 函数需要根据实际情况进行定义或替换。
method 参数可以根据需要选择不同的决策树构建方法，例如 ID3、C4.5 等。

希望这段代码和说明能够帮助你理解决策树算法的实现过程！