基于 VITISRGAN模型遥感图像超分辨率重建
编号:57
访问权限:仅限参会人
更新:2025-09-10 13:46:42 浏览:283次
口头报告
摘要
遥感图像的空间分辨率直接影响地物信息提取与环境监测的精度。然而,由于传感器硬件限制和观测条件约束,现有遥感影像常难以同时满足大范围覆盖与高分辨率需求。为提升遥感影像的空间表达能力,本文在经典 SRGAN 框架的基础上提出了一种改进的超分辨率重建模型——VIT-ISRGAN(Vit based improved super-resolution generative adversarial network)。该模型在生成器中引入轻量化残差模块(Light Weight Block)、通道注意力模块(SE Block)以及 Vision Transformer 结构,以增强特征提取能力并降低冗余计算。其中,轻量化残差模块通过通道混洗和深度可分离卷积有效减少模型参数,SE Block 自适应地调整特征通道权重,Vision Transformer 则通过自注意力机制捕捉遥感影像的全局依赖关系。
在 Sentinel-2 与资源一号 02D 卫星影像构建的数据集上开展实验,并与 Bicubic、VDSR、EDSR 及 SRGAN 等方法进行对比。结果表明,本文提出的 VIT-ISRGAN 在客观指标上优于对比模型,峰值信噪比(PSNR)和结构相似性(SSIM)分别达到 39.240 dB 和 0.9417,较原始 SRGAN 提升明显。同时,在城镇、农田、水体及林地等不同场景的重建实验中,本模型在纹理细节和色彩还原方面均取得了更佳的主观视觉效果。进一步在棉花根腐病研究区的应用验证显示,该方法在病害区域边界和纹理信息恢复方面表现优越,为农业监测等实际场景提供了更高精度的图像数据支撑。综上,VIT-ISRGAN 有效提升了遥感影像超分辨率重建质量,兼具较强的特征表达能力与参数效率,具有良好的推广和应用价值。
关键词
遥感图像;超分辨率重建;生成对抗网络;Vision Transformer (ViT);轻量化网络模块;通道注意力机制
稿件作者
赵恒谦
中国矿业大学(北京)
杨屹峰
中国矿业大学(北京)
皇甫霞丹
中国矿业大学(北京)
孙莎莎
中国矿业大学(北京)
发表评论