Python机器学习：使用Scikit-learn构建逻辑回归模型并预测鸢尾花种类

本示例演示如何使用 Python 中的 Scikit-learn 库构建逻辑回归模型，用于预测鸢尾花的种类。

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn import datasets

# 加载 iris 数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
print('样本数量: ', len(y))

# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建逻辑回归分类器
clf = LogisticRegression(C=1.0, penalty='l1', tol=1e-6)

# 训练模型
clf.fit(X_train, y_train)

# 预测结果
ans = clf.predict(X_test)

# 计算准确率
cnt = 0
for i in range(len(y_test)):
    if abs(ans[i] - y_test[i]) < 1e-1:
        cnt += 1
    # print(ans[i], ' ', y_test[i])
print('准确率: ', (cnt * 100.0 / len(y_test)),'%')

程序流程

加载 iris 数据集: 使用 datasets.load_iris() 函数加载经典的鸢尾花数据集。
划分训练集和测试集: 使用 train_test_split() 函数将数据集划分为训练集和测试集，测试集占比为 30%。
创建逻辑回归分类器: 使用 LogisticRegression() 函数创建一个逻辑回归分类器，并设置参数（例如正则化强度和容忍度）。
训练模型: 使用训练集 (X_train, y_train) 调用 fit() 方法训练逻辑回归模型。
预测结果: 使用测试集 (X_test) 调用 predict() 方法进行预测，得到预测结果 ans。
计算预测准确率: 比较预测结果 ans 和真实标签 y_test，计算预测准确率。

Python机器学习：使用Scikit-learn构建逻辑回归模型并预测鸢尾花种类