Python机器学习:使用KNN和SVM算法实现鸢尾花分类
Python机器学习:使用KNN和SVM算法实现鸢尾花分类
本篇文章将演示如何使用Python中的Scikit-learn库来实现机器学习中的两个经典算法:K近邻算法(KNN)和支持向量机(SVM),并以著名的鸢尾花数据集为例进行分类任务。
1. 代码实现
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
# 加载数据集
iris = load_iris()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)
# KNN算法
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
knn_pred = knn.predict(X_test)
knn_acc = accuracy_score(y_test, knn_pred)
print('KNN accuracy:', knn_acc)
# SVM(支持向量机)算法
svm = SVC(kernel='linear')
svm.fit(X_train, y_train)
svm_pred = svm.predict(X_test)
svm_acc = accuracy_score(y_test, svm_pred)
print('SVM accuracy:', svm_acc)
2. 代码解读
2.1 导入必要的库
首先,我们需要导入所需的库:
sklearn.datasets用于加载鸢尾花数据集。sklearn.model_selection用于划分训练集和测试集。sklearn.neighbors用于导入 KNN 分类器。sklearn.svm用于导入 SVM 分类器。sklearn.metrics用于评估模型性能,这里使用accuracy_score计算准确率。
2.2 加载数据集和数据预处理
使用 load_iris() 函数加载鸢尾花数据集,然后使用 train_test_split() 函数将数据集划分为训练集和测试集。
2.3 KNN算法实现
- 创建一个 KNN 分类器对象
knn,并设置n_neighbors参数(即 K 值)为 3。 - 使用训练数据
X_train和y_train对knn进行训练。 - 使用测试数据
X_test进行预测,得到预测结果knn_pred。 - 使用
accuracy_score()函数计算 KNN 模型的准确率knn_acc。
2.4 SVM算法实现
- 创建一个 SVM 分类器对象
svm,并设置核函数kernel为 'linear'。 - 使用训练数据
X_train和y_train对svm进行训练。 - 使用测试数据
X_test进行预测,得到预测结果svm_pred。 - 使用
accuracy_score()函数计算 SVM 模型的准确率svm_acc。
3. 结果分析
最后,程序会输出 KNN 和 SVM 算法的准确率。通过比较两个模型的准确率,可以评估哪个模型在该任务上表现更好。
4. 总结
本篇文章介绍了如何使用 Python 和 Scikit-learn 库实现 KNN 和 SVM 算法进行鸢尾花分类。该代码简单易懂,适合初学者学习和实践。此外,还可以尝试不同的参数设置和核函数,以探索模型性能的提升空间。
原文地址: https://www.cveoy.top/t/topic/jthb 著作权归作者所有。请勿转载和采集!