图像数据库、偏见和去噪扩散概率模型的关键研究论文

这份精选的学术著作清单涵盖了计算机视觉和机器学习领域的广泛主题,包括图像数据库、算法公平性和去噪扩散概率模型。

图像数据库

  • Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei. Imagenet: A large-scale hierarchical image database. In CVPR, 2009. 这篇文章介绍了ImageNet,这是一个大规模的分层图像数据库,它改变了计算机视觉研究。

  • Karan Desai, Gaurav Kaul, Zubin Trivadi Aysola, and Justin Johnson. Redcaps: Web-curated image-text data created by the people, for the people. In NeurIPS Datasets and Benchmarks Track, 2021. 本文介绍了Redcaps,这是一个由网络策划的图像文本数据集,强调了更加多样化和包容性的数据集的需求。

算法公平性和偏见

  • Thomas B Fitzpatrick. The validity and practicality of sun-reactive skin types I through VI. Archives of dermatology, 124(6):869–871, 1988. 这篇开创性的论文介绍了菲茨帕特里克量表,该量表对算法公平性和偏见研究具有重要意义,尤其是在皮肤病学领域。

  • J. L. Fleiss. Measuring nominal scale agreement among many raters. Psychological Bulletin, 76(5):378–382, 1971. 这篇论文介绍了Fleiss' kappa,这是一种统计量度,用于评估多个评分者之间名义尺度上的一致性,与评估算法公平性相关。

  • Alex Hanna, Emily Denton, Andrew Smart, and Jamila Smith-Loud. Towards a critical race methodology in algorithmic fairness. In FAccT, 2020. 本文呼吁在算法公平性中采用关键种族方法论,强调了解决算法系统中系统性偏见的必要性。

  • Yusuke Hirota, Yuta Nakashima, and Noa Garcia. Gender and racial bias in visual question answering datasets. In FAccT, 2022. 这项研究调查了视觉问答数据集中的性别和种族偏见,突出了算法系统中潜在的社会偏见。

  • Yusuke Hirota, Yuta Nakashima, and Noa Garcia. Quantifying societal bias amplification in image captioning. In CVPR, 2022. 本文量化了图像字幕中的社会偏见放大,表明算法系统会加剧现有的社会偏见。

  • Yusuke Hirota, Yuta Nakashima, and Noa Garcia. Model-agnostic gender debiased image captioning. In CVPR, 2023. 作者提出了一种模型无关的性别去偏图像字幕方法,旨在减轻图像字幕中的性别偏见。

去噪扩散概率模型

  • Jonathan Ho, Ajay Jain, and Pieter Abbeel. Denoising diffusion probabilistic models. NeurIPS, 2020. 本文介绍了去噪扩散概率模型,这是一种强大的生成模型,它在图像生成和其它领域取得了令人印象深刻的结果。

这些论文代表了计算机视觉和机器学习领域的重要贡献,解决了广泛的主题,从建立大规模图像数据库到解决算法公平性和推进生成建模技术。


原文地址: https://www.cveoy.top/t/topic/fBDB 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录