使用 Python 和 Scikit-learn 实现决策树分类器
这段代码使用 Python 和 Scikit-learn 库实现了一个决策树分类器模型,并计算了模型在测试集上的准确率。
from sklearn import tree
from sklearn import datasets
from sklearn.model_selection import train_test_split
# 加载iris数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
print('Sample num: ', len(y))
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 模型初始化并训练
clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)
# 预测结果
ans = clf.predict(X_test)
# 计算准确率
cnt = 0
for i in range(len(y_test)):
if ans[i] - y_test[i] < 1e-1:
cnt += 1
# print(ans[i], ' ', y_test[i])
print('Accuracy: ', (cnt * 100.0 / len(y_test)),'%')
具体来说,代码执行了以下步骤:
- 加载 Iris 数据集: 使用
datasets.load_iris()加载了 sklearn 自带的 Iris 数据集,并将特征数据存储在X中,标签存储在y中。 - 划分训练集和测试集: 使用
train_test_split函数将数据集分成训练集和测试集,比例为 7:3,并设置随机种子为 42。 - 模型初始化和训练: 使用
tree.DecisionTreeClassifier()初始化了一个决策树分类器模型,并使用fit()方法对训练集进行训练。 - 预测结果: 使用训练好的模型对测试集进行预测,并将预测结果存储在
ans中。 - 计算准确率: 通过比较预测结果和真实标签,计算模型在测试集上的准确率。
这段代码展示了如何使用 Python 和 Scikit-learn 库来实现一个简单的决策树分类器模型,并展示了如何评估模型的性能。
原文地址: https://www.cveoy.top/t/topic/mBz8 著作权归作者所有。请勿转载和采集!