Python机器学习：使用KNN和SVM算法实现鸢尾花分类

本篇文章将演示如何使用Python中的Scikit-learn库来实现机器学习中的两个经典算法：K近邻算法（KNN）和支持向量机（SVM），并以著名的鸢尾花数据集为例进行分类任务。

1. 代码实现

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# KNN算法
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
knn_pred = knn.predict(X_test)
knn_acc = accuracy_score(y_test, knn_pred)
print('KNN accuracy:', knn_acc)

# SVM（支持向量机）算法
svm = SVC(kernel='linear')
svm.fit(X_train, y_train)
svm_pred = svm.predict(X_test)
svm_acc = accuracy_score(y_test, svm_pred)
print('SVM accuracy:', svm_acc)

2. 代码解读

2.1 导入必要的库

首先，我们需要导入所需的库：

sklearn.datasets 用于加载鸢尾花数据集。
sklearn.model_selection 用于划分训练集和测试集。
sklearn.neighbors 用于导入 KNN 分类器。
sklearn.svm 用于导入 SVM 分类器。
sklearn.metrics 用于评估模型性能，这里使用 accuracy_score 计算准确率。

2.2 加载数据集和数据预处理

使用 load_iris() 函数加载鸢尾花数据集，然后使用 train_test_split() 函数将数据集划分为训练集和测试集。

2.3 KNN算法实现

创建一个 KNN 分类器对象 knn，并设置 n_neighbors 参数（即 K 值）为 3。
使用训练数据 X_train 和 y_train 对 knn 进行训练。
使用测试数据 X_test 进行预测，得到预测结果 knn_pred。
使用 accuracy_score() 函数计算 KNN 模型的准确率 knn_acc。

2.4 SVM算法实现

创建一个 SVM 分类器对象 svm，并设置核函数 kernel 为 'linear'。
使用训练数据 X_train 和 y_train 对 svm 进行训练。
使用测试数据 X_test 进行预测，得到预测结果 svm_pred。
使用 accuracy_score() 函数计算 SVM 模型的准确率 svm_acc。

3. 结果分析

最后，程序会输出 KNN 和 SVM 算法的准确率。通过比较两个模型的准确率，可以评估哪个模型在该任务上表现更好。

4. 总结

本篇文章介绍了如何使用 Python 和 Scikit-learn 库实现 KNN 和 SVM 算法进行鸢尾花分类。该代码简单易懂，适合初学者学习和实践。此外，还可以尝试不同的参数设置和核函数，以探索模型性能的提升空间。