使用 PHASE 注释评估视觉和语言任务中的社会偏见
使用 PHASE 注释评估视觉和语言任务中的社会偏见
本文介绍了如何利用 PHASE 注释来评估视觉和语言任务中的社会偏见。我们关注三个主要任务:图像字幕、文本-图像嵌入和文本到图像生成。
图像注释
PHASE 中的注释与图像区域相关联。然而,我们分析的三个任务需要图像级别的信息。为了解决这个问题,我们将区域级注释转换为图像级注释。
为此,我们只使用所有区域级注释属于同一类的图像。例如,如果一张图片中所有关于性别的区域级注释都是'女性',那么这张图片就被标记为'女性'。包含特定属性的不同类别注释的图像将不被使用。
需要注意的是,这种方法并非唯一的方法,可以根据具体的评估类型采用其他方法。
此外,为了解决注释数量较少的问题,我们将'婴儿'和'儿童'合并为一个类别:'婴儿和儿童'。
原文地址: https://www.cveoy.top/t/topic/fBBe 著作权归作者所有。请勿转载和采集!