在给定的一组视频帧中,我们可以按照预定的布局方式对它们进行排序,以形成时空特征图像。对于不同的稀疏采样帧数,本文提供了不同的排列方式。根据以往的图像分类方法,图像的输入大小通常为规则的224*224。因此,本文提供了更规则的正方形结构作为排列方式,并提供了两个不同视频帧之间的最短距离。这样做可以更好地帮助模型学习不同帧之间的时序信息。如果网格未满,则在末尾填充空图像。

时空特征图像生成:视频帧排序方法及最短距离优化

原文地址: https://www.cveoy.top/t/topic/bZWg 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录