基于梯度提升回归树的疾病预测模型优化
基于梯度提升回归树的疾病预测模型优化
本文旨在利用机器学习模型预测疾病发生的可能性。研究中构建了一系列模型,并通过调整模型的'超参数'来优化其预测性能。与参数较少的第一性原理模型不同,这些机器学习模型可能出现过拟合现象,导致其对新案例的预测能力下降。
为了解决这个问题,我们对模型进行了超参数调整,以优化其预测性能。具体而言,我们采用10倍交叉验证来估计新病例的预期预测误差。这意味着将数据划分为训练集和验证集,并在训练集上拟合模型,然后在验证集上评估其预测效果。
研究发现,随机森林(RF)和梯度提升回归树(GBRT)的性能优于支持向量回归(SVR)和核岭回归(KRR)。其中,GBRT模型的预测因子表现最佳,其决定系数(R2)为0.803,均方根误差(RMSD)为1.083。因此,我们将GBRT模型作为最终的预测模型,并将其命名为GBRT-1,用于后续的疾病预测研究。
原文地址: https://www.cveoy.top/t/topic/f2Pb 著作权归作者所有。请勿转载和采集!