近日,自动化学院颜成钢教授团队以杭电为第一单位的论文被多媒体领域的国际会议ACM Multimedia (CCF A类会议)录用。该项研究由颜成钢教授团队与中国科学院计算技术研究所李亮副研究员合作完成。第一作者为智能信息处理实验室硕士生张杰华,通讯作者为李亮,作者名单中还包含了智能信息处理实验室的颜成钢、张继勇老师等。
ACM MM是多媒体研究领域的首要国际会议,也是计算机图形学与多媒体方向仅有三个CCF A类会议之一。ACM MM2021 一共收到 1,942 篇论文申请,最终入选 542 篇论文(约 27.9% 的接受率)。
该论文Heuristic Depth Estimation with Progressive Depth Reconstruction and Confidence-Aware Loss提出了一种包含渐进式深度重建和可信度感知的启发式深度估计框架,探索了对低成本距离传感器数据的高效利用,提升了基于深度学习的深度估计网络的准确率以及对细小物体的重建能力。深度估计任务的目的在于根据输入彩色图片预测每个像素点的到相机的距离,在现实世界的许多应用中扮演着重要的角色,例如增强现实、虚拟现实和自动驾驶。在稀疏深度样本的帮助下,现有基于深度学习的方法获得了较高的准确率。然而,这些方法通常直接从高置信度稀疏深度样本中推理出密集的深度图,忽略了低置信度样本中的信息,我们提出一种渐进式的深度估计方法和可信度感知损失,利用低可信度的样本蒸馏出空间几何和局部语义信息用于优化深度图。具体来说,我们首先训练一个U-NET网络,用稀疏深度样本生成粗糙的深度图和相应的置信度图。其次,一个渐进式深度重建网络利用彩色图像和粗糙深度图,逐步的从多个尺度重建出细粒度的密集深度图,其中有一个新设计的多级上采样模块用于恢复物体的局部结构。最后,我们提出了一个可信度感知损失函数,鼓励网络关注低可信度的样本,引导网络针对性的优化深度预测误差较大的区域,例如细小物体的结构和物体的轮廓等。
转自 杭电新闻 原文链接 http://www.hdu.edu.cn/news/important_29168
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学