使用 Python 和 Scikit-learn 实现决策树分类器

这段代码使用 Python 和 Scikit-learn 库实现了一个决策树分类器模型，并计算了模型在测试集上的准确率。

from sklearn import tree
from sklearn import datasets
from sklearn.model_selection import train_test_split

# 加载iris数据集
iris = datasets.load_iris()

X = iris.data
y = iris.target

print('Sample num: ', len(y))

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 模型初始化并训练
clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)

# 预测结果
ans = clf.predict(X_test)
# 计算准确率
cnt = 0
for i in range(len(y_test)):
    if ans[i] - y_test[i] < 1e-1:
        cnt += 1
    # print(ans[i], ' ', y_test[i])
print('Accuracy: ', (cnt * 100.0 / len(y_test)),'%')

具体来说，代码执行了以下步骤：

加载 Iris 数据集：使用 datasets.load_iris() 加载了 sklearn 自带的 Iris 数据集，并将特征数据存储在 X 中，标签存储在 y 中。
划分训练集和测试集：使用 train_test_split 函数将数据集分成训练集和测试集，比例为 7:3，并设置随机种子为 42。
模型初始化和训练：使用 tree.DecisionTreeClassifier() 初始化了一个决策树分类器模型，并使用 fit() 方法对训练集进行训练。
预测结果：使用训练好的模型对测试集进行预测，并将预测结果存储在 ans 中。
计算准确率：通过比较预测结果和真实标签，计算模型在测试集上的准确率。

这段代码展示了如何使用 Python 和 Scikit-learn 库来实现一个简单的决策树分类器模型，并展示了如何评估模型的性能。