图像识别中的公平性分析:年龄、性别、肤色和种族的影响
图像识别中的公平性分析:年龄、性别、肤色和种族的影响
本文分析了图像识别系统在不同人群属性上的表现,包括年龄、性别、肤色和种族,并探讨了潜在的公平性问题。
主要发现:
- 年龄: 婴儿、儿童和老年人识别率最高 (R@k),而年轻人和成年人的识别率较低,R@10 指标差距高达 18.1。这与地区分析(第 5 节)和图像描述(第 6.1 节)的结果一致,表明年龄是具有最高类别差异的属性。* 性别: 男性样本的表现始终优于女性样本。* 肤色: 深肤色的 R@k 高于浅肤色。这可能与语言偏见有关,即较浅的肤色通常不会被描述,而较深的肤色会被描述 [34,47,60]。* 种族: 种族识别结果不一致。R@1 中,最高的类别是东亚和印度人,但在 R@5 和 R@10 中是中东人。最低的类别是拉丁裔、东南亚人和黑人。这种不一致性以及较低的标注者一致性(第 4 节)表明,种族标注具有高度主观性。
结论:
- 更多的样本并不一定意味着更好的召回率,样本数量并非性能差异的唯一来源。例如,尽管成年人和年轻人样本最多,但他们的识别率却最低。肤色也是如此,尽管浅肤色样本占主导地位,但深肤色的 R@k 更高。相反,在性别方面,无论是在样本数量还是在 R@k 方面,男性的表现都优于女性。
本研究强调了在图像识别系统中解决公平性问题的重要性,并呼吁开展进一步研究以减轻潜在的偏见。
原文地址: https://www.cveoy.top/t/topic/fBBM 著作权归作者所有。请勿转载和采集!