Swin Transformer: 基于Transformer架构的主干网络
Swin Transformer是一种基于Transformer架构的主干网络,它在计算机视觉领域展现出了优异的性能。它通过引入'滑动窗口'机制,将图像划分为多个不重叠的窗口,并对每个窗口应用Transformer模块。这种设计使得Swin Transformer能够有效地处理高分辨率图像,并保留了Transformer的全局信息建模能力。
原文地址: https://www.cveoy.top/t/topic/mYXS 著作权归作者所有。请勿转载和采集!