分割解码器的功能是将输入图像中的每个像素与可驾驶区域或背景标签相连。我们将大小为'(H/32,W/32,1024)'的特征图送入分割解码模块。经过五次上采样模块操作后,我们将输出特征图恢复到原始图像大小,表示输入图像中每个像素是背景还是可驾驶区域的可能性。我们的上采样模块包括上采样操作和RepBottleneckCSP模块,它基于由CSPNet架构连接的Rep卷积组。因为CSP架构可以在减少计算量的同时实现更丰富的梯度组合,而RepConv则通过在训练期间使用多通道结构和在推理期间使用单通道结构,使网络具有更好的拟合能力,因此RepBotterneckCSP模块被用于许多主流网络中。

为了让分割解码模块更多地关注可驾驶区域的模糊边界,这通常被视为可驾驶区域分割中的难题,我们使用CBAM模块在第一次上采样操作后重新分配特征的权重,我们认为这是必要的。给定中间特征图,CBAM模块沿两个独立的维度(通道和空间)顺序推断注意力图,然后将注意力图与输入特征图相乘,执行自适应特征优化。

RepBotterneckCSP和CBAM的流程图分别为图3和图4。

可驾驶区域分割解码器:基于RepBottleneckCSP和CBAM的优化

原文地址: https://www.cveoy.top/t/topic/nd7d 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录