SMOTE ENN 是一种结合了 SMOTE (Synthetic Minority Over-sampling Technique) 和 ENN (Edited Nearest Neighbors) 的过采样和欠采样技术。

SMOTE 是一种用于解决类别不平衡问题的过采样技术。它通过生成合成的少数类样本来平衡数据集,从而提高分类算法对少数类的泛化能力。SMOTE 通过在少数类样本之间插入合成样本来增加数据集中少数类的样本数量,以使少数类样本的分布更加均衡。

ENN 是一种欠采样技术,用于减少多数类样本的数量,以平衡数据集。ENN 通过删除多数类样本中与相邻少数类样本相距最近的样本,以减少噪音和重叠的样本。

SMOTE ENN 结合了 SMOTE 和 ENN 的优点,旨在同步地处理类别不平衡问题。它首先使用 SMOTE 生成合成样本来增加少数类样本的数量,然后使用 ENN 删除多数类样本中的噪音和重叠样本,以实现数据集的平衡和减少样本的冗余。

通过使用 SMOTE ENN,可以改善类别不平衡数据集的性能,并提高分类算法对少数类的预测能力。它是一种常用的数据预处理技术,特别适用于二分类问题中的类别不平衡情况。

SMOTE ENN: 改善类别不平衡数据集性能的过采样和欠采样技术

原文地址: http://www.cveoy.top/t/topic/n2C 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录