乳腺癌数据集逻辑回归模型训练与预测：代码实现及混淆矩阵可视化

本代码使用 Python 的 scikit-learn 库对乳腺癌数据集进行逻辑回归模型训练和预测，并使用 seaborn 库绘制混淆矩阵图以直观展示预测结果。

import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_breast_cancer
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# 加载乳腺癌数据
data = load_breast_cancer(return_X_y=True)
X = data[0]
y = data[1]

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# 创建并训练逻辑回归模型
model = LogisticRegression(max_iter=10000)
model.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = model.predict(X_test)

# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)

# 绘制混淆矩阵图
sns.heatmap(cm, annot=True, cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.show()

# 输出分类报告
print('预测结果：', classification_report(y_test, y_pred))

代码首先加载乳腺癌数据集，并将其划分为训练集和测试集。然后，创建并训练逻辑回归模型。在测试集上进行预测后，计算混淆矩阵并使用 seaborn 库绘制混淆矩阵图。最后，输出预测结果的分类报告。

运行以上代码后，您将得到一个绘制了二分类混淆矩阵的图形结果，并在终端中输出预测结果的分类报告。这些指标将帮助您评估逻辑回归模型在乳腺癌数据集上的性能。