摘要——大规模变压器网络可以实现最先进的红外小目标检测准确性,但高计算资源消耗使它们的推理速度不令人满意。现有的轻量级网络可以确保红外小目标的实时检测,但无论轻量级策略设计得多么精心,这些网络与大规模网络相比的准确性仍存在差距。为了解决这些问题,本文提出了一种轻量级红外小目标检测网络,能够进行高速推理,并提出了一种知识蒸馏方法,用于从变压器网络中学习更高阶语义信息。具体而言,基于深度可分离膨胀卷积,我们设计了检测网络的每个阶段,称为多尺度膨胀金字塔网络(MDPNet),作为一个多分支并行金字塔。这种设计可以增大网络的感受野,并增强网络提取上下文特征的能力。此外,我们利用知识蒸馏来弥合与变压器的检测性能差距。基于自我注意机制,在教师变压器和学生卷积网络之间构建一个语义蒸馏子网络,使得不同机制的网络之间更有效地跨模型传输有关高阶语义特征提取的知识,并增加检测准确性而不增加计算负载。我们通过详尽的实验展示了整体网络设计和学习方法的合理性和有效性。在广泛接受的公共数据集SIRST和NUDT-SIRST上,nIoU分别达到74.88和75.10,PD分别达到99.08和97.88,优于其他网络。仅有0.23M个参数的网络在320×320的红外图像上实现了137 FPS的推理速度。

英文翻译中文英文原文:Abstract—Large-scale transformer networks can achieve state-of-the-art infrared small target detection accuracy but the highcomputational resource consumption makes their inference speed un

原文地址: https://www.cveoy.top/t/topic/bTfZ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录