LoGoNet: 提升LiDAR-相机融合性能的三维物体检测方法

LoGoNet是一种在局部和全局两个层面上进行LiDAR-相机信息融合的方法。在全局融合方面，它通过添加点质心来更精确地表示体素特征的位置，从而实现更好的跨模态对齐。在局部融合方面，它将每个proposal划分为均匀的网格，并将这些网格中心投影到图像上。然后，通过采样围绕投影点的网格点的图像特征，并与带有位置信息的点云特征进行融合，LoGoNet能够最大限度地利用proposal周围丰富的上下文信息。此外，该方法还引入了特征动态聚合模块，用于实现局部和全局融合特征之间的信息交互，产生更具信息量的多模态特征。

通过局部和全局融合策略，LoGoNet能够更准确地对齐LiDAR和相机数据，并提供更丰富的上下文信息。它通过结合点云和图像的特征，获得更全面、准确的多模态特征表示。这使得LoGoNet在三维物体检测和定位任务中具有更好的性能和鲁棒性。