在动态监测、变化检测和土地覆盖分类等领域,需要高空间分辨率的遥感影像和密集的时间序列来捕捉详细的地表动态[1]–[10]。然而,由于技术限制和预算限制,遥感影像的时间和空间分辨率通常存在权衡[11]–[14]。近年来,尽管通过Sentinel-2和中国高分辨率地球观测系统(CHEOS)等多平台卫星获得了高空间和高时间分辨率的遥感影像,但由于云覆盖和其他干扰的存在,当前遥感数据的可用性在实际应用中仍然不足[15],[16]。不足的遥感数据无法满足长期和详细的地表动态研究的要求,这些要求需要具有高空间分辨率的密集历史时间序列遥感影像[17]–[20]。时空融合是促进当前地球观测数据应用的一种可行和经济有效的方式。时空融合旨在整合多源卫星图像,获得具有高空间和高时间分辨率的图像。例如,MODIS数据具有高时间分辨率和低空间分辨率(LSHT),而Landsat Enhanced Thematic Mapper Plus(ETM +)数据具有高空间分辨率和低时间分辨率(HSLT)[21],[22]。基于先前日期上的一个或两个Landsat-MODIS图像对和一个预测日期上的MODIS图像,时空融合模型可以将Landsat图像的空间分辨率与MODIS图像的时间频率相结合,生成预测日期上类似Landsat的图像。

近年来,已经提出了许多时空融合方法,以尝试在不同空间和时间分辨率的各种传感器的遥感数据中聚合数据。一般来说,当前的时空融合方法可以分为三类:1)基于权重函数的方法;2)基于解混合的方法;3)基于学习的方法[23],[24]。在基于权重函数的方法中,通过权重函数组合所有输入图像的信息来估计细像素值[24]。在基于权重函数的算法中,最具代表性的例子是空间和时间自适应反射融合模型(STARFM)[25]及其增强版本(ESTARFM)[26]。经典的STARFM建立了HSLT和LSHT像素之间的简单近似关系,并根据光谱差异、时间差异和位置距离搜索相似的邻近像素。考虑到复杂的异质区域的存在,Zhu等人[26]提出了ESTARFM,通过为均质区域和异质区域分配不同的转换系数来修改邻近像素的权重。然而,这两个算法都建立在每个土地覆盖类型的比例在观测期间不发生变化的假设下,这并没有考虑地球表面上的人类活动,如扰动事件(例如森林火灾)和城市土地利用变化。为了解决这个问题,Hilker等人[27]提出了一种用于映射反射变化的空间和时间自适应算法(STAARCH),用于突发扰动事件的映射。此外,Zhao等人[28]开发了一种用于复杂地表变化的鲁棒自适应空间和时间图像融合模型(RASTFM)。基于权重函数的方法的缺点是采用邻近像素可能会引入预测图像的模糊,从而导致高频细节的丢失。

基于线性光谱混合理论,解混合方法对粗像素进行解混合以估计细像素的值。Zhukov等人[29]首次提出了多传感器多分辨率技术(MMT),用于整合不同时间获取的不同空间分辨率的遥感影像。然而,MMT面临两个问题:1)由于光谱解混合引起的大误差;2)端元光谱变异的缺乏。为了解决这些问题,Zurita-Milla等人[30]提出了空间-时间数据融合方法(STDFA),通过考虑通过在移动窗口中解混合端元反射率估计的反射率变化来获得预测。STDFA还通过使用自适应移动窗口大小进行了改进[31]。然而,解混合方法在土地覆盖类型变化预测方面仍然存在困难,这是由于缺乏高空间分辨率的土地利用数据库所限制的,这限制了它们的应用。

随着机器学习的发展,近年来提出了基于学习的方法。Huang和Song[32]提出了基于稀疏表示的时空反射融合模型(SPSTFM),这是第一种将字典对学习技术从自然图像超分辨率引入时空数据融合的方法。在SPSTFM之后,为了处理单个先前的Landsat-MODIS图像对的情况,Song和Huang[33]通过一对图像学习开发了另一种基于稀疏表示的时空卫星图像融合(SSIF)模型。基于稀疏表示的方法旨在通过学习字典对提取HSLT Landsat和LSHT MODIS图像之间的映射关系。然后,通过加权预测来预测融合图像,权重来自观测期间的两个结束日期的预测。然而,基于稀疏表示的方法需要为不同研究区域的图像重新学习字典,这是低效的。与字典学习相比,深度学习在各种遥感场景上具有更好的泛化能力。Song等人[34]提出了一种使用深度卷积神经网络(STFDCNN)进行时空图像融合的方法。卷积神经网络(CNN)用于建模粗分辨率(CR)图像和细分辨率(FR)图像之间的关系,并使用高通融合模型进行预测。Liu等人[35]通过考虑时态依赖性和时态一致性改进了STFDCNN,并提出了一种用于时空图像融合的双流CNN(StfNet)。然而,这两种基于CNN的方法仍然存在一些局限性。首先,STFDCNN和StfNet不是端到端学习模型。预测阶段分为两部分,基于CNN的映射和重构,增加了算法的复杂性。其次,每个波段需要单独训练,这增加了参数量、内存使用和训练时间的增加。


原文地址: https://www.cveoy.top/t/topic/i3wG 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录