利用视频编码中的视觉冗余主要有两种方法。一种是基于计算感知模型如CSF、JND、ROI等将其视为指导感知编码的常见视觉特征如比特分配和模式决策。然后使用VQA度量评估压缩视频的质量。另一种方法是将VQA模型或其近似应用于RD代价函数的失真项这在RDO中用作选择最佳编码模式或参数的标准。在应用VQA度量来优化编码过程时必须注意几个主要困难。1质量评估模型是从粗粒度MOS生成的粗粒度为1-5有五个尺度
该段落主要讨论了在视频编码中利用视觉冗余的两种方法:基于计算感知模型和应用VQA模型。然而,这些方法存在一些挑战和困难,如质量评估模型粗粒度、区分度不准确,视频评估需要自适应,基于VQA模型的RD成本比较需要解决计算复杂度等问题。此外,由于HVS的复杂性和视频编码模块的多样性,构建适用于各种视频应用的VQA模型也具有挑战性。因此,感知优化视频编码存在三个具有挑战性的问题:构建准确的感知模型和适应各种视频应用的VQA、视频编码模块的适应和复杂的RD成本比较过程。
引用文中内容:计算感知模型、VQA模型、MSE/MAD、基于深度学习的VQAs。
原文地址: https://www.cveoy.top/t/topic/flQL 著作权归作者所有。请勿转载和采集!