Python机器学习:使用Scikit-learn构建逻辑回归模型并预测鸢尾花种类
Python机器学习:使用Scikit-learn构建逻辑回归模型并预测鸢尾花种类
本示例演示如何使用 Python 中的 Scikit-learn 库构建逻辑回归模型,用于预测鸢尾花的种类。
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn import datasets
# 加载 iris 数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
print('样本数量: ', len(y))
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建逻辑回归分类器
clf = LogisticRegression(C=1.0, penalty='l1', tol=1e-6)
# 训练模型
clf.fit(X_train, y_train)
# 预测结果
ans = clf.predict(X_test)
# 计算准确率
cnt = 0
for i in range(len(y_test)):
if abs(ans[i] - y_test[i]) < 1e-1:
cnt += 1
# print(ans[i], ' ', y_test[i])
print('准确率: ', (cnt * 100.0 / len(y_test)),'%')
程序流程
- 加载 iris 数据集: 使用
datasets.load_iris()函数加载经典的鸢尾花数据集。 - 划分训练集和测试集: 使用
train_test_split()函数将数据集划分为训练集和测试集,测试集占比为 30%。 - 创建逻辑回归分类器: 使用
LogisticRegression()函数创建一个逻辑回归分类器,并设置参数(例如正则化强度和容忍度)。 - 训练模型: 使用训练集 (
X_train,y_train) 调用fit()方法训练逻辑回归模型。 - 预测结果: 使用测试集 (
X_test) 调用predict()方法进行预测,得到预测结果ans。 - 计算预测准确率: 比较预测结果
ans和真实标签y_test,计算预测准确率。
原文地址: https://www.cveoy.top/t/topic/jtf8 著作权归作者所有。请勿转载和采集!