1. R-CNN (2014)

R-CNN是基于深度神经网络的目标检测算法的开山之作。它的核心思想是将输入的图像分成多个区域,然后对每个区域进行卷积特征提取,再将特征输入SVM分类器中,最后用回归器对每个区域进行边框回归。

  1. Fast R-CNN (2015)

Fast R-CNN是对R-CNN的改进。它通过引入RoI池化层,将特征图与RoI对齐,从而消除了R-CNN中繁琐的特征映射对RoI的对齐问题。同时,Fast R-CNN还使用了多任务损失函数,将分类和边框回归的损失函数联合起来,提高了性能。

  1. Faster R-CNN (2015)

Faster R-CNN是基于Fast R-CNN的改进。它引入了RPN (Region Proposal Network) 网络,用于生成候选区域,代替了R-CNN中的Selective Search。RPN是一种全卷积神经网络,可以共享特征提取器的卷积层,从而加速候选区域的生成。

  1. YOLO (2016)

YOLO (You Only Look Once) 是一种单阶段目标检测算法,它将目标检测问题看成一个回归问题,同时使用卷积神经网络直接预测每个目标的类别和边框。由于YOLO没有使用候选区域,因此它的速度非常快,而且可以实时运行。

  1. SSD (2016)

SSD (Single Shot MultiBox Detector) 是一种单阶段目标检测算法,它使用了多个不同大小和宽高比的锚框来检测不同大小和形状的目标。SSD使用卷积神经网络对输入图像进行特征提取,然后将特征图输入到多个卷积层和全连接层中,预测所有锚框的类别和边框。

  1. RetinaNet (2017)

RetinaNet是一种基于金字塔特征网络的目标检测算法,它使用了一种新的损失函数,解决了单阶段目标检测算法中的类别不平衡问题。RetinaNet使用了特征金字塔网络来处理不同大小的目标,同时使用了Focal Loss来平衡正负样本的数量。

  1. Mask R-CNN (2017)

Mask R-CNN是一种基于Faster R-CNN的目标检测算法,它可以同时进行目标检测和语义分割。Mask R-CNN使用了RoI Align层来提取RoI的特征,然后分别对其进行分类、边框回归和语义分割。

  1. Cascade R-CNN (2018)

Cascade R-CNN是一种基于Faster R-CNN的目标检测算法,它使用了级联的检测器来提高性能。Cascade R-CNN包括三个级联检测器,每个检测器都在前一个检测器的基础上进行训练,从而逐步提高性能。

  1. EfficientDet (2019)

EfficientDet是一种高效的目标检测算法,它使用了一种新的模型架构和特征金字塔网络。EfficientDet使用了一种复合系数,将不同的模型大小和特征金字塔网络融合在一起,从而实现高效的目标检测。

总的来说,基于深度学习的目标检测算法经历了从R-CNN到EfficientDet的发展历程,不断地提高着性能和效率。

深度学习目标检测算法发展历程:从R-CNN到EfficientDet

原文地址: https://www.cveoy.top/t/topic/nF2J 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录