学术动态 | 我院博士研究生赵祉钤的论文被人工智能领域顶级会议AAAI录用

近日,以我院博士研究生赵祉钤为第一作者的论文被人工智能领域顶级会议AAAI Conference on Artificial Intelligence(AAAI-25,CCF-A)录用。AAAI是人工智能领域涵盖内容最广泛、持续时间最久的国际顶级学术会议之一,同时也是中国计算机学会推荐的A类国际学术会议。

论文《Heterogeneous Prompt-Guided Entity Inferring and Distilling for Scene-Text Aware Cross-modal Retrieval》第一作者为通信工程学院2024级博士研究生赵祉钤,指导老师为我校颜成钢教授和中国科学院计算技术研究所李亮研究员。该项研究由杭州电子科技大学、中国科学院计算技术研究所和杭州电子科技大学丽水研究院合作完成。

在跨模态检索(Cross-modal Retrieval,CMR)中,全面理解图像至关重要,图像中的场景文本可以提供细粒度信息来理解视觉语义。然而,现有方法未能充分利用场景文本,往往将其单独处理,导致语义歧义问题,并忽略了图像-文本对中场景文本的异构概念。为此,本研究设计了异构提示引导的实体推理与蒸馏(HOPID)网络,通过视觉提示与文本提示对场景文本进行对齐。同时,本研究提出了感知实体蒸馏模块,从细粒度层面提取和优化场景文本信息,最终获得更加鲁棒的场景文本表示。大量实验表明,该方法在两个公共数据集上显著优于现有方法。更多演示请访问https://my-hopid.github.io

图片

杭州电子科技大学“智能信息处理”实验室 (HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生200余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名企业。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。


联系我们

联系人:孙老师

电话:0571-86878691

工作电话:0571-86878691

电子邮箱:syq@hdu.edu.cn

智能信息处理实验室

浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学