对于图像数据的特征提取,之前的主流方法是基于ResNet模型及其改进版本。近两年来,在计算机视觉领域中,有大量的研究聚焦于ViT模型。在诸多场景和任务上,ViT模型展现出了优于ResNet模型的效果。此外,预训练的ViT模型也可以在下游任务中进行微调和应用,无需大规模的训练数据和算力。因此,本章选择预训练的ViT模型作为图像特征提取模块。

图像特征提取:为何选择预训练ViT模型?

原文地址: https://www.cveoy.top/t/topic/mHV6 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录