使用 PHASE 注释评估视觉和语言任务中的社会偏见

本文介绍了如何利用 PHASE 注释来评估视觉和语言任务中的社会偏见。我们关注三个主要任务:图像字幕、文本-图像嵌入和文本到图像生成。

图像注释

PHASE 中的注释与图像区域相关联。然而,我们分析的三个任务需要图像级别的信息。为了解决这个问题,我们将区域级注释转换为图像级注释。

为此,我们只使用所有区域级注释属于同一类的图像。例如,如果一张图片中所有关于性别的区域级注释都是'女性',那么这张图片就被标记为'女性'。包含特定属性的不同类别注释的图像将不被使用。

需要注意的是,这种方法并非唯一的方法,可以根据具体的评估类型采用其他方法。

此外,为了解决注释数量较少的问题,我们将'婴儿'和'儿童'合并为一个类别:'婴儿和儿童'。

使用 PHASE 注释评估视觉和语言任务中的社会偏见

原文地址: https://www.cveoy.top/t/topic/fBBe 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录