Python机器学习:使用Scikit-learn构建逻辑回归模型
使用Python和Scikit-learn构建逻辑回归模型
本教程将指导您使用Python中的Pandas和Scikit-learn库构建一个简单的逻辑回归模型。
1. 数据准备
首先,我们需要导入必要的库并加载数据集。这里我们使用Pandas读取Excel文件:pythonimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import accuracy_score
读取数据集data = pd.read_excel('附件1.xlsx')
提取特征属性和分类属性X = data.drop(labels=['特征1', '特征2', '特征3', '特征4', '特征5', '特征6', '特征7', '特征8','特征9'], axis=1)y = data['类别']
将数据集分为训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=100)
2. 模型训练
接下来,我们创建逻辑回归模型,并在训练集上进行训练:python# 创建逻辑回归模型model = LogisticRegression()
在训练集上训练模型model.fit(X_train, y_train)
3. 模型评估
训练完成后,我们在测试集上进行预测,并计算模型准确率:python# 在测试集上进行预测y_pred = model.predict(X_test)
计算准确率accuracy = accuracy_score(y_test, y_pred)print('模型准确率:', accuracy)
4. 模型保存和加载
为了方便以后使用,我们可以将训练好的模型保存到磁盘:python# 保存模型import joblibjoblib.dump(model, 'logistic_regression_model.pkl')
加载模型loaded_model = joblib.load('logistic_regression_model.pkl')
5. 使用模型进行预测
我们可以使用加载的模型对新数据进行预测:python# 对新数据进行预测new_data = pd.read_excel('new_data.xlsx')predictions = loaded_model.predict(new_data)
显示预测结果print(predictions)
6. 模型可视化
为了更好地理解模型,我们可以使用matplotlib库进行可视化:python# 可视化模型import matplotlib.pyplot as pltfrom sklearn.inspection import plot_partial_dependence
fig, ax = plt.subplots(figsize=(10, 10))plot_partial_dependence(model, X_train, features=[0, 1, 2], ax=ax)plt.show()
总结
本教程介绍了使用Python和Scikit-learn构建简单逻辑回归模型的基本步骤。您可以根据自己的数据和需求调整代码,并尝试使用其他机器学习算法解决更复杂的问题。
原文地址: https://www.cveoy.top/t/topic/f1fk 著作权归作者所有。请勿转载和采集!