使用Python和Scikit-learn构建逻辑回归模型

本教程将指导您使用Python中的Pandas和Scikit-learn库构建一个简单的逻辑回归模型。

1. 数据准备

首先，我们需要导入必要的库并加载数据集。这里我们使用Pandas读取Excel文件：pythonimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import accuracy_score

读取数据集data = pd.read_excel('附件1.xlsx')

提取特征属性和分类属性X = data.drop(labels=['特征1', '特征2', '特征3', '特征4', '特征5', '特征6', '特征7', '特征8','特征9'], axis=1)y = data['类别']

将数据集分为训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=100)

2. 模型训练

接下来，我们创建逻辑回归模型，并在训练集上进行训练：python# 创建逻辑回归模型model = LogisticRegression()

在训练集上训练模型model.fit(X_train, y_train)

3. 模型评估

训练完成后，我们在测试集上进行预测，并计算模型准确率：python# 在测试集上进行预测y_pred = model.predict(X_test)

计算准确率accuracy = accuracy_score(y_test, y_pred)print('模型准确率：', accuracy)

4. 模型保存和加载

为了方便以后使用，我们可以将训练好的模型保存到磁盘：python# 保存模型import joblibjoblib.dump(model, 'logistic_regression_model.pkl')

加载模型loaded_model = joblib.load('logistic_regression_model.pkl')

5. 使用模型进行预测

我们可以使用加载的模型对新数据进行预测：python# 对新数据进行预测new_data = pd.read_excel('new_data.xlsx')predictions = loaded_model.predict(new_data)

显示预测结果print(predictions)

6. 模型可视化

为了更好地理解模型，我们可以使用matplotlib库进行可视化：python# 可视化模型import matplotlib.pyplot as pltfrom sklearn.inspection import plot_partial_dependence

fig, ax = plt.subplots(figsize=(10, 10))plot_partial_dependence(model, X_train, features=[0, 1, 2], ax=ax)plt.show()

总结

本教程介绍了使用Python和Scikit-learn构建简单逻辑回归模型的基本步骤。您可以根据自己的数据和需求调整代码，并尝试使用其他机器学习算法解决更复杂的问题。

Python机器学习：使用Scikit-learn构建逻辑回归模型