乳腺癌数据集逻辑回归模型训练与预测:代码实现及混淆矩阵可视化
本代码使用 Python 的 scikit-learn 库对乳腺癌数据集进行逻辑回归模型训练和预测,并使用 seaborn 库绘制混淆矩阵图以直观展示预测结果。
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_breast_cancer
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# 加载乳腺癌数据
data = load_breast_cancer(return_X_y=True)
X = data[0]
y = data[1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 创建并训练逻辑回归模型
model = LogisticRegression(max_iter=10000)
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)
# 绘制混淆矩阵图
sns.heatmap(cm, annot=True, cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.show()
# 输出分类报告
print('预测结果:', classification_report(y_test, y_pred))
代码首先加载乳腺癌数据集,并将其划分为训练集和测试集。然后,创建并训练逻辑回归模型。在测试集上进行预测后,计算混淆矩阵并使用 seaborn 库绘制混淆矩阵图。最后,输出预测结果的分类报告。
运行以上代码后,您将得到一个绘制了二分类混淆矩阵的图形结果,并在终端中输出预测结果的分类报告。这些指标将帮助您评估逻辑回归模型在乳腺癌数据集上的性能。
原文地址: http://www.cveoy.top/t/topic/blZc 著作权归作者所有。请勿转载和采集!