•对于年龄属性,婴儿和儿童以及老年人具有最好的R@k,而年轻人和成年人的R@10差距高达18.1。年龄类别之间的巨大差异与地区分析(第5节)和图像字幕(第6.1节)的结果一致,这是具有最高类别方差的属性。 •在性别方面,男性样本的表现始终优于女性样本。 •在肤色方面,较深的肤色比较浅的肤色具有更高的R@k。这可能可以解释为语言偏见,即较浅的肤色通常不会描述肤色,而较深的肤色会描述肤色[34,47,60]。 •种族属性不一致。在R@1中,最高的类别是东亚和印度人,但在R@5和R@10中是中东人。最低的类别是拉丁裔、东南亚人和黑人。缺乏一致性以及低的标注者一致性(第4节)表明种族注释是高度主观的。 •更多的样本并不意味着更好的召回率,这意味着样本数量不是(唯一的)性能差异的来源。例如,在年龄方面,尽管成年人和年轻人是最常见的,但它们的表现最差。在肤色方面也是如此;尽管较浅的样本占主导地位,但较深的样本的R@k更高。相反,在性别方面,无论是在样本数量还是在R@k方面,男性的表现都优于女性。

For the age attribute baby & child and senior have the best Rk while young and adult fall well behind with a difference of up to 181 in R10 The big differences in the age classes are consistent with t

原文地址: http://www.cveoy.top/t/topic/hTua 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录