请翻译：We describe an approach to object and scene retrieval which searches for and localizes all the occurrences of a user outlined object in a video The object is represented by asetofviewpoint invaria

日期: 2027-02-27

标签: 科技

我们描述了一种对象和场景检索方法，该方法搜索并定位视频中用户标明的对象的所有出现。该对象由一组视点不变的区域描述符表示，以便在视点、照明和部分遮挡发生变化时，仍能成功识别。视频中镜头的时间连续性用于跟踪区域，以拒绝不稳定的区域并减少描述符中噪声的影响。与文本检索的类比在于实现，其中描述符的匹配是预先计算的（使用向量量化），并使用倒排文件系统和文档排名。结果是检索是即时的，以类似Google的方式返回关键帧/镜头的排名列表。该方法用于两个完整的特色电影匹配进行了说明。

请翻译：We describe an approach to object and scene retrieval which searches for and localizes all the occurrences of a user outlined object in a video The object is represented by asetofviewpoint invaria

原文地址: https://www.cveoy.top/t/topic/bBVT 著作权归作者所有。请勿转载和采集!