GCC 与 MSCOCO 数据集比较:性别和肤色标注分析

本文将 GCC 数据集中的性别和肤色标注与 Zhao 等人 [60] 在 MSCOCO 中的标注进行了比较。

性别标注: 在 MSCOCO 中,报告的性别为 47.4% 的男性区域和 23.7% 的女性区域,差距为 23.7 个百分点,小于 GCC 中的 28.5 个百分点。

肤色标注: 就肤色而言,MSCOCO 中较浅肤色(类型 1、2 和 3)与较深肤色(类型 4、5 和 6)之间的差距报告为 52.9(从 61% 到 8.1%),而 GCC 中的差距为 64(从 79.7% 到 15.7%)。

这表明,自动爬取的 GCC 数据集在性别和肤色属性上比手动注释的 MSCOCO 数据集更加不平衡。

GCC 数据集区域分析

我们分析了 GCC 数据集中不同人口类别的区域如何呈现。

图 5 显示了每个类别的平均面积和到图像中心的距离。

  • 年龄: 最明显的差异在于年龄属性,老年人和婴儿是所有类别中面积较大的区域,而儿童是面积较小的区域。婴儿类别也比其他年龄段的人更靠近图像中心。* 性别: 性别区域在大小和位置上没有太大的差异。* 肤色和种族: 较浅肤色的区域比较深肤色的区域更大,而种族则呈现较大的差异,东南亚种族的区域离中心最远,白种人的区域最大。

结论: GCC 数据集在性别和肤色属性上存在显著的不平衡,这在进行模型训练和评估时需要加以考虑。

GCC vs. MSCOCO:性别和肤色标注的比较分析

原文地址: https://www.cveoy.top/t/topic/fBqK 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录