GEM 池化:用于无监督图像检索的强大池化方法
在论文 'Fine-tuning CNN Image Retrieval with No Human Annotation' 中,作者提出了一种名为 'Global Expansion Pooling' (GEM) 的新型池化方法。GEM 池化是一种可微分的非线性池化方法,可以有效地提升图像检索性能,无需额外的人工标注。
GEM 池化的核心思想是通过对全局特征图进行自适应池化来捕捉更多空间信息。具体来说,GEM 池化将全局特征图分割成多个网格,计算每个网格内部特征的平均值,然后将该平均值扩展至整个网格。这种扩展方式使每个网格的特征向量包含更多空间信息,从而提升图像检索效果。
与传统池化方法相比,GEM 池化具有以下优势:
-
可微性:GEM 池化是可微分的,能够与卷积神经网络一同训练,进一步提升图像检索性能。
-
自适应性:GEM 池化是自适应的,可以根据每个图像的特征图大小进行调整,适应不同尺寸的图像。
-
鲁棒性:GEM 池化对输入特征图中的噪声和变形具有一定的鲁棒性,有助于提升图像检索的稳定性。
总而言之,GEM 池化是一种有效的池化方法,能够在无需额外标注的情况下显著提升图像检索性能。
原文地址: https://www.cveoy.top/t/topic/jqBe 著作权归作者所有。请勿转载和采集!