Deformable DETR的每一层Decoder的self-attention的qkv由什么输入?
Deformable DETR的每一层Decoder的self-attention的qkv输入包括三部分:query、key和value。这三部分都是由Decoder的输入特征图经过三个不同的线性变换得到的。具体来说,query是由输入特征图通过一个query的线性变换得到的,key和value是由输入特征图通过两个不同的线性变换得到的。在Deformable DETR中,这些线性变换是可学习的,因此可以根据具体任务对它们进行调整。
原文地址: http://www.cveoy.top/t/topic/bsz8 著作权归作者所有。请勿转载和采集!