近日,我校智能信息处理团队以杭州电子科技大学为第一单位发表的论文《Quality-Aware Selective Fusion Network for V-D-T Salient Object Detection》被国际权威期刊IEEE Transactions on Image Processing(TIP)录用。该论文的第一作者为我校2022级直博生鲍柳昕,指导老师为我校颜成钢教授、张继勇教授和周晓飞副教授。 显著目标检测(SOD)的目的是找到和分割图像中最引人注目的区域,其作为计算机视觉中的一项基本且关键的任务,已广泛应用于许多计算机视觉任务中。然而,现有的三模态SOD方法无法感知深度图像和热红外图像的质量,这导致了在处理质量不佳的深度和热红外图像的场景时的检测性能显著下降。基于上述问题,该研究提出了一种质量感知选择性融合网络(QSF-Net)来进行Visible-Depth-Thermal(VDT)显著目标检测任务。该网络由三个子网络构成:初始特征提取子网络、质量感知区域选择子网络和区域引导选择性融合子网络。首先,初始特征提取子网络不仅负责提取特征,还通过收缩金字塔结构(MSF)模块生成初步预测图。接着,我们设计了弱监督的质量感知区域选择子网络,用以生成质量感知驱动的预测图。具体来说,我们首先利用多模态的初步预测图识别深度模态和热红外模态中的高质量和低质量的区域,再根据上述区域进一步生成伪标签,以供训练该子网络。最后,区域引导选择性融合子网络在质量感知预测图的指导下对初始特征进行净化,并通过模态内和模态间注意力(IIA)模块及边缘细化(ER)模块,分别融合三模态特征以及细化预测图的边缘细节。通过在三模态SOD数据集上的广泛实验,表明本研究所提出的QSF-Net模型在与现有方法的比较中,保持着较为显著的性能优势。
杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师40余名,含5位国家级人才及多位省级人才。现有硕博生100余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于通信、自动化、计算机、电子等学院。
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学