Python机器学习:使用KNN和SVM算法实现鸢尾花分类

本篇文章将演示如何使用Python中的Scikit-learn库来实现机器学习中的两个经典算法:K近邻算法(KNN)和支持向量机(SVM),并以著名的鸢尾花数据集为例进行分类任务。

1. 代码实现

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# KNN算法
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
knn_pred = knn.predict(X_test)
knn_acc = accuracy_score(y_test, knn_pred)
print('KNN accuracy:', knn_acc)

# SVM(支持向量机)算法
svm = SVC(kernel='linear')
svm.fit(X_train, y_train)
svm_pred = svm.predict(X_test)
svm_acc = accuracy_score(y_test, svm_pred)
print('SVM accuracy:', svm_acc)

2. 代码解读

2.1 导入必要的库

首先,我们需要导入所需的库:

  • sklearn.datasets 用于加载鸢尾花数据集。
  • sklearn.model_selection 用于划分训练集和测试集。
  • sklearn.neighbors 用于导入 KNN 分类器。
  • sklearn.svm 用于导入 SVM 分类器。
  • sklearn.metrics 用于评估模型性能,这里使用 accuracy_score 计算准确率。

2.2 加载数据集和数据预处理

使用 load_iris() 函数加载鸢尾花数据集,然后使用 train_test_split() 函数将数据集划分为训练集和测试集。

2.3 KNN算法实现

  • 创建一个 KNN 分类器对象 knn,并设置 n_neighbors 参数(即 K 值)为 3。
  • 使用训练数据 X_trainy_trainknn 进行训练。
  • 使用测试数据 X_test 进行预测,得到预测结果 knn_pred
  • 使用 accuracy_score() 函数计算 KNN 模型的准确率 knn_acc

2.4 SVM算法实现

  • 创建一个 SVM 分类器对象 svm,并设置核函数 kernel 为 'linear'。
  • 使用训练数据 X_trainy_trainsvm 进行训练。
  • 使用测试数据 X_test 进行预测,得到预测结果 svm_pred
  • 使用 accuracy_score() 函数计算 SVM 模型的准确率 svm_acc

3. 结果分析

最后,程序会输出 KNN 和 SVM 算法的准确率。通过比较两个模型的准确率,可以评估哪个模型在该任务上表现更好。

4. 总结

本篇文章介绍了如何使用 Python 和 Scikit-learn 库实现 KNN 和 SVM 算法进行鸢尾花分类。该代码简单易懂,适合初学者学习和实践。此外,还可以尝试不同的参数设置和核函数,以探索模型性能的提升空间。

Python机器学习:使用KNN和SVM算法实现鸢尾花分类

原文地址: https://www.cveoy.top/t/topic/jthb 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录