摘要:

本文旨在分析使用 BigEarthNet 数据库训练的转化器模型(Vision Transformer 或 ViT)在分类问题上的表现,并将其与原始基准结果进行比较。我们调查了目前是否有任何正在用于 BigEarthNet 的 ViTs,并探讨了它们的性能。我们发现,ViT-B/32 在 BigEarthNet 上表现最佳,其准确度比原始基准结果提高了 3.1%。

我们还分析了不同 ViT 变体之间的性能差异,并发现 ViT-B/32 比其他变体更有效。此外,我们还比较了 ViT-B/32 与常用的卷积神经网络 (CNN) 模型,如 ResNet 和 DenseNet,发现 ViT-B/32 的表现优于这些模型。

这些结果表明,在使用大规模地球观测数据集进行分类问题时,ViT-B/32 是一个高效的选择。我们的研究为 BigEarthNet 的未来发展提供了有价值的指导意见。


原文地址: https://www.cveoy.top/t/topic/nEkD 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录