数据集被认为是不平衡的,如果其中一个类别的样本数量远远少于另一个类别。一般来说,当某个类别的样本数量少于总样本数量的10%时,可以将数据集视为不平衡数据。

例如,假设有一个二分类问题,其中一个类别的样本数量只有100个,而另一个类别的样本数量是900个,那么这个数据集就可以被认为是不平衡的。

怎样的数据集才能看作不平衡数据

原文地址: http://www.cveoy.top/t/topic/iTlu 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录