机器学习笔试题:过拟合与ROC曲线
1. 什么是过拟合?如何避免过拟合?
过拟合是指模型在训练数据上表现良好,但在测试数据上表现较差的现象。这是因为模型过于复杂,过度拟合了训练数据,导致对新数据的泛化能力较差。
避免过拟合的方法包括:
- 增加训练数据量
- 使用正则化方法
- 简化模型复杂度
- 使用集成学习等。
2. 什么是ROC曲线?如何解释ROC曲线上的点?
ROC曲线是一种衡量二分类模型性能的图形化方法。ROC曲线的横轴是假正例率(FPR),纵轴是真正例率(TPR),它们分别定义为:
- FPR = FP / (FP + TN)
- TPR = TP / (TP + FN)
其中,TP表示真正例数,FP表示假正例数,TN表示真负例数,FN表示假负例数。
ROC曲线上的每个点代表一个不同的分类阈值,当分类阈值从高到低变化时,对应的点将从右上角向左下角移动。对于一个好的分类器,ROC曲线越接近左上角,其性能越好。
原文地址: https://www.cveoy.top/t/topic/n9Nc 著作权归作者所有。请勿转载和采集!