使用Python和Scikit-learn构建逻辑回归模型

本教程将指导您使用Python中的Pandas和Scikit-learn库构建一个简单的逻辑回归模型。

1. 数据准备

首先,我们需要导入必要的库并加载数据集。这里我们使用Pandas读取Excel文件:pythonimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import accuracy_score

读取数据集data = pd.read_excel('附件1.xlsx')

提取特征属性和分类属性X = data.drop(labels=['特征1', '特征2', '特征3', '特征4', '特征5', '特征6', '特征7', '特征8','特征9'], axis=1)y = data['类别']

将数据集分为训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=100)

2. 模型训练

接下来,我们创建逻辑回归模型,并在训练集上进行训练:python# 创建逻辑回归模型model = LogisticRegression()

在训练集上训练模型model.fit(X_train, y_train)

3. 模型评估

训练完成后,我们在测试集上进行预测,并计算模型准确率:python# 在测试集上进行预测y_pred = model.predict(X_test)

计算准确率accuracy = accuracy_score(y_test, y_pred)print('模型准确率:', accuracy)

4. 模型保存和加载

为了方便以后使用,我们可以将训练好的模型保存到磁盘:python# 保存模型import joblibjoblib.dump(model, 'logistic_regression_model.pkl')

加载模型loaded_model = joblib.load('logistic_regression_model.pkl')

5. 使用模型进行预测

我们可以使用加载的模型对新数据进行预测:python# 对新数据进行预测new_data = pd.read_excel('new_data.xlsx')predictions = loaded_model.predict(new_data)

显示预测结果print(predictions)

6. 模型可视化

为了更好地理解模型,我们可以使用matplotlib库进行可视化:python# 可视化模型import matplotlib.pyplot as pltfrom sklearn.inspection import plot_partial_dependence

fig, ax = plt.subplots(figsize=(10, 10))plot_partial_dependence(model, X_train, features=[0, 1, 2], ax=ax)plt.show()

总结

本教程介绍了使用Python和Scikit-learn构建简单逻辑回归模型的基本步骤。您可以根据自己的数据和需求调整代码,并尝试使用其他机器学习算法解决更复杂的问题。

Python机器学习:使用Scikit-learn构建逻辑回归模型

原文地址: https://www.cveoy.top/t/topic/f1fk 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录