机器学习笔试题:异常值识别和过拟合/欠拟合问题

1. 给定一个数据集,如何判断是否存在异常值?

答案:常见的方法是使用箱线图(Box Plot)或者 z-score 标准化方法。箱线图可以将数据集分成四分位数,并将异常值作为离群点标记出来。z-score 标准化方法可以计算每个数据点与均值的距离,然后标准化为一个标准偏差。

2. 什么是过拟合和欠拟合?如何解决这两个问题?

答案:过拟合指模型在训练集上表现很好,但在测试集上表现很差的现象,通常是因为模型过于复杂,学习了训练集中的噪声和细节。欠拟合指模型无法捕捉到数据集中的重要特征,通常是因为模型过于简单。

解决过拟合的方法包括:数据增强、正则化(L1,L2)、提前终止(Early Stopping)等。解决欠拟合的方法包括:增加特征、增加模型复杂度、更换模型等。

机器学习笔试题:异常值识别和过拟合/欠拟合问题

原文地址: https://www.cveoy.top/t/topic/n9M8 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录