学术动态 | 我院博士后程志明在模式识别领域顶级期刊《Pattern Recognition》发表论文

学术动态 | 我院博士后程志明在模式识别领域顶级期刊《Pattern Recognition》发表论文

 以下文章来源于杭电通信家园                                                                  

        近日,我院博士后程志明作为第一作者在模式识别领域顶级期刊《Pattern Recognition》发表题为“Domain generalization for image classification with dynamic decision boundary”的研究论文https://doi.org/10.1016/j.patcog.2025.111678)

论文的第一作者为通信工程学院博士后程志明,合作导师为我校颜成钢教授和王帅研究员,合作者为北卡罗来纳大学教堂山分校刘明霞教授、杭州师范大学副教授杨德富副教授以及我校赵治栋教授,该论文由杭州电子科技大学、杭州师范大学以及北卡罗来纳大学教堂山分校合作完成。

该研究主要关注面向图像分类的领域泛化问题。基于领域泛化(DG)的图像分类旨在无需访问目标域数据的情况下,有效应对源域和目标域之间的分布偏移。传统的DG方法通常依赖于在源域上训练的静态模型,用于在不可见目标域上进行推理,这限制了其充分利用目标域特征的能力。基于测试时自适应(TTA)的DG方法通过在推理过程中使用目标域样本对模型进行自适应调整,从而提高泛化性能。然而,这类方法通常需要在不可见的目标域上进行参数微调,这可能导致源域知识遗忘或降低实时推理性能。

为了解决这一局限性,该研究提出了一种基于动态决策边界的域泛化(DDB-DG)图像分类方法,该方法能够在推理阶段有效利用目标域特征,而无需额外训练。具体而言,该方法首先引入了原型引导的多级预测模块(PMP),该模块通过利用测试样本与原型之间的关联,引导从源域学习到的决策边界的动态调整。为了提高原型计算的准确性,该方法还提出了一种不确定性风格混合(USM)的数据增强方法,该方法通过扩展训练样本的多样性,提高模型的泛化能力,并增强目标域样本伪标签的准确性,以优化原型表示。

该研究在三个公开的基准数据集(PACS、Office-Home 和 VLCS)上使用不同的主干网络(ResNet-18 和 ResNet-50)验证了DDB-DG的有效性。实验结果表明,该研究在ResNet-18 和 ResNet-50 上均能实现优于当前最先进的DG和TTA方法的性能。

图片


杭州电子科技大学“智能信息处理”实验室 (HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生200余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名企业。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。


图文:程志明

排版:王晨辉

审核:江劭玮

责编:张   涵

发布:张霆岳



联系我们

联系人:孙老师

电话:0571-86878691

工作电话:0571-86878691

电子邮箱:syq@hdu.edu.cn

智能信息处理实验室

浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学