与许多以候选框集合(即两阶段方法中的区域提议和一阶段方法中的锚框)为基础对参考对象进行定位的先前方法不同,TransVG直接推断四维向量作为要定位的框的坐标。这简化了训练阶段的目标分配和正/负样本挖掘过程,但也涉及到尺度问题。具体来说,广泛使用的平滑L1损失在试图预测大框时往往会变得很大,而在试图预测小框时往往会变得很小,即使它们的预测具有相似的相对误差。

翻译一下:Unlike many previous methods that ground referred ob-jects based on a set of candidates ie region proposals intwo-stagemethodsandanchorboxesinone-stagemethodsTransVG directly infers a 4-dim vecto

原文地址: http://www.cveoy.top/t/topic/fmsI 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录