62 / 2022-09-29 21:59:15
面向单幅图像的高质量深度估计
终稿
包永堂 / 山东科技大学
燕帅 / 山东科技大学
齐越 / 北京航空航天大学
单幅图像的深度估计是机器人导航、场景理解等领域中的一项关键任务,也是计算机视觉领域的一个复杂问题。近年来,随着深度学习的快速发展,利用神经网络对单幅图像进行高质量的深度估计已成为一个研究热点。然而,在许多研究中仍然存在一些深度估计错误,这主要是因为网络没有很好地处理图像的上下文信息。针对单幅图像深度估计不准确的问题,提出一种基于ViT的单幅图像深度估计方法。首先通过预训练的DenseNet对图像进行下采样,同时将特征编码成适用于ViT的特征序列;之后通过稠密连接的ViT处理全局上下文信息,并将特征序列重新组装成高维度特征图;然后通过RefineNet进行上采样,得到完整的深度图像;最后在NYU V2数据集上与最近的深度估计方法进行对比实验,并对网络结构进行消融实验,同时对平均相对误差、均方根误差等误差进行量化分析。结果表明,该方法面向单幅图像可以生成具有丰富细节的高质量深度图像。与传统的编码器解码器方法相比,所提方法的PSNR值平均提高了1.052,REL指标下降了7.7%~21.8%,RMS指标下降了5.6%~16.9%。
重要日期
  • 会议日期

    11月18日

    2022

    11月20日

    2022

  • 10月25日 2022

    初稿截稿日期

  • 11月20日 2022

    终稿截稿日期

  • 11月21日 2022

    注册截止日期

主办单位
中国仿真学会
中国图象图形学会
中国计算机学会
承办单位
北京航空航天大学云南研究院
云南大学
云南艺术学院
昆明理工大学
协办单位
虚拟现实技术与系统国家重点实验室(北京航空航天大学)
北京市混合现实与新型显示工程技术研究中心(北京理工大学)
计算机辅助设计与图形学国家重点实验室(浙江大学)
文旅部闽台非遗文化数字化保护与智能处理文化和旅游部重点实验室(厦门大学)
云南省人工智能重点实验室(昆明理工大学)
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询