可以尝试以下几种方法来解决模型过拟合的问题：

增加数据量：可以尝试增加更多的数据样本来训练模型，这样可以减少模型对于训练数据的过拟合程度。
减少特征数量：可以尝试减少特征数量，只选择对分类结果有较大影响的特征进行训练。
增加正则化项：可以在模型训练过程中增加正则化项，如L1正则化或L2正则化，来减少模型的复杂度，从而减少过拟合的风险。
使用集成学习方法：可以尝试使用集成学习方法，如随机森林或梯度提升树等，来减少模型的过拟合风险。

具体实现可以参考以下代码：

创建随机森林模型

clf = RandomForestClassifier(n_estimators=100, max_depth=10, random_state=0)

训练模型

clf.fit(X_train, Y_train) Y_pred = clf.predict(X_test) accuracy = accuracy_score(Y_test, Y_pred) precision = precision_score(Y_test, Y_pred, average='macro') recall = recall_score(Y_test, Y_pred, average='macro') f1 = f1_score(Y_test, Y_pred, average='macro')

messagebox.showinfo('提示', f'随机森林模型构建成功！\n模型预测准确率：{accuracy:.4%}\n模型精确度：{precision:.4%}\n模型召回率：{recall:.4%}\n模型F1值：{f1:.4%}'

def build_clf1 global data clfX_trainX_testY_trainY_test #对用户输入值的合法性判断 if data is None messageboxshowerror错误请先读取数据！ return # 创建决策树模型 clf = DecisionTreeClassifier #

def build_clf1 global data clfX_trainX_testY_trainY_test #对用户输入值的合法性判断 if data is None messageboxshowerror错误 请先读取数据！ return # 创建决策树模型 clf = DecisionTreeClassifier #

创建随机森林模型

训练模型

def build_clf1 global data clfX_trainX_testY_trainY_test #对用户输入值的合法性判断 if data is None messageboxshowerror错误请先读取数据！ return # 创建决策树模型 clf = DecisionTreeClassifier #