基于补丁的自监督学习:通过相对位置预测提升语义理解
Doersch等人在2015年提出了一种基于补丁的自监督学习方法[24]。该方法的核心思想是将原始数据集中的图像分成一个由九个不同块组成的3*3网格,并预测中心块与其他八个不同块之间的相对位置,形成一个8分类的上游任务。这种上游任务可以让模型学习到与位置相关的图像上下文信息,从而能够区分同一对象中不同部分之间的相对位置,从而有助于提取与对象空间相关的高级语义信息。
原文地址: https://www.cveoy.top/t/topic/jqx6 著作权归作者所有。请勿转载和采集!