请翻译:We describe an approach to object and scene retrieval which searches for and localizes all the occurrences of a user outlined object in a video The object is represented by asetofviewpoint invaria
我们描述了一种对象和场景检索方法,该方法搜索并定位视频中用户标明的对象的所有出现。该对象由一组视点不变的区域描述符表示,以便在视点、照明和部分遮挡发生变化时,仍能成功识别。视频中镜头的时间连续性用于跟踪区域,以拒绝不稳定的区域并减少描述符中噪声的影响。与文本检索的类比在于实现,其中描述符的匹配是预先计算的(使用向量量化),并使用倒排文件系统和文档排名。结果是检索是即时的,以类似Google的方式返回关键帧/镜头的排名列表。该方法用于两个完整的特色电影匹配进行了说明。
原文地址: https://www.cveoy.top/t/topic/bBVT 著作权归作者所有。请勿转载和采集!