时空特征图像:视频帧排序与排列方法
本文提出了一种将给定的一组视频帧按照预定布局排序以形成时空特征图像的方法,适用于稀疏采样获得不同帧数的场景。为了满足图像分类模型对规则输入大小的要求(例如 224*224),本文采用更规则的正方形结构进行排列,并提供了两个不同视频帧之间的最短距离计算公式,以帮助模型更好地学习其不同帧之间的时序信息。如果网格未满,则在末尾填充空图像。
计算公式如下:
公式 (1): 图像的总帧数 = 行数 * 列数
公式 (2): 两个不同帧之间的最短距离 = 行数 + 列数
根据这两个公式,可以确定视频帧的排列方式。首先确定视频帧的总帧数,然后确定行数和列数。根据行数和列数,可以计算出两个不同帧之间的最短距离。然后,将视频帧按照指定的排列方式进行排序,如果网格未满,则在末尾填充空图像。通过这种排列方式,可以更好地学习视频帧之间的时序信息。
原文地址: https://www.cveoy.top/t/topic/bZXM 著作权归作者所有。请勿转载和采集!