import numpy as np import pandas as pd from sklearnlinear_model import LogisticRegression from sklearnmetrics import roc_auc_score from sklearnmodel_selection import train_test_split # 读取数据 data = pd

这个错误提示意思是输入的变量样本数量不一致，其中y_train有22397个样本，而pred_test有2001个样本。这是因为在计算AUC值时，应该使用训练集的预测结果pred_train而不是测试集的预测结果pred_test。

将auc_tra = roc_auc_score(y_train, pred_test)修改为auc_tra = roc_auc_score(y_train, clf.predict_proba(X_train)[:, 1])即可。

原文地址: https://www.cveoy.top/t/topic/erEx 著作权归作者所有。请勿转载和采集!