近年来,小目标检测取得了很大的进展。研究人员主要改进了以下问题:1)小物体的特征信息极其缺乏,2)小石块物体更密集地排列,更不规则,更容易被遮挡。首先,许多研究在数据操作方法方面进行了改进。最直接的方法是增加数据集中小目标的数量。[13]首先提出了在数据集中随机复制小目标的策略,简单直接地增加小目标的数量。在此基础上,陈等提出了[7]网络,在复制和粘贴小目标样本之前确定小目标的背景。此外,段、魏等人[14,15]提出了多种使用马赛克解决小目标检测问题的方法,并取得了一定的成果。YOLOv4 [16]论文中提出了马赛克数据增强方法。其主要思想是随机切割四张图片,然后将它们拼接成一张图片作为训练数据。这样做的优点是丰富了图像的背景,并且四张图片被拼接在一起,以伪装的方式提高了批量大小,四张图片也将在批量归一化时进行计算。

对于小物体,最重要的是在相应的比例尺上完成特征提取。 Dollár [17]使用图像金字塔和滑动窗口方案提取特征。杨等人[18]选择了适当大小的特征层进行小物体特征的池化操作。蔡等人提出了MS-CNN [19]方法,以选择不同层比例尺上的小目标最佳接收区域。在特征融合的解决方案中,林等人[8]首先提出了特征金字塔网络(FPN),其目的是在低分辨率的高分辨率语义特征中聚合高级别特征。这种简单而有效的设计已成为特征提取器的重要组成部分。Zand等人在DarkNet-53的基础上构建了DarkNet RI [20],使用跳跃连接生成不同比例尺的高级语义特征图。

使用注意力机制也是小目标检测的常见方法。其主要原则是使用权重关系获取更应该关注的特征信息。SE Attention [21]模块是比较注意力,其特点是在特殊通道的维度中添加注意力机制。ECA-Net [22]模块通过使用一维卷积有效地捕捉跨通道交互。CBAM [23]从通道和空间的两个范围开始,引入空间注意力和通道注意力的两个分析维度,并实现了从通道到空间的顺序注意力结构。

在智能采矿领域,任等人[24]提出了一种多尺度特征融合方法,用于开放式采矿区道路障碍物检测,对特征进行了归一化、压缩和提取多尺度特征。宋等人[25]在自己的数据集上使用多尺度和注意力融合模块捕捉更丰富的上下文特征,并在矿山目标检测领域取得了良好的结果。

小目标检测技术研究进展:从数据增强到特征融合和注意力机制

原文地址: https://www.cveoy.top/t/topic/lSlH 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录