Python 随机森林代码示例:分类任务
这里是一个简单的 Python 随机森林代码示例,展示了如何使用 sklearn 库进行分类任务:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# 生成随机数据集
X, y = make_classification(n_samples=1000, n_features=4, n_informative=2, n_redundant=0, random_state=0, shuffle=False)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 构建随机森林分类器
clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0)
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = clf.score(X_test, y_test)
print('Accuracy: %.2f%%' % (accuracy * 100.0))
在这个代码中,我们使用了 sklearn 库中的 RandomForestClassifier 类来构建随机森林分类器。首先,我们生成了一个包含 4 个特征的数据集,其中有 2 个特征是有信息量的,另外 2 个特征是冗余的。然后,我们将数据集划分成训练集和测试集,然后使用 RandomForestClassifier 类构建一个包含 100 个决策树的随机森林模型,并设置最大树深度为 2。最后,我们训练模型,预测测试集,计算准确率并输出结果。
原文地址: https://www.cveoy.top/t/topic/nr9t 著作权归作者所有。请勿转载和采集!