我校智能信息处理团队论文被多媒体领域顶级会议ACM Multimedia录用

近日,我校智能信息处理团队以杭州电子科技大学为第一单位发表的论文《It Takes Two: Accurate Gait Recognition in the Wild via Cross-granularity Alignment》被多媒体领域顶级国际学术会议ACM Multimedia 2024(CCF A类会议)录用。

该项研究由杭州电子科技大学、京东探索研究院、杭州电子科技大学丽水研究院和中国科学技术大学合作完成。该论文的第一作者为我校通信工程学院特聘副教授郑锦凯,合作者还有我校颜成钢教授和张继勇教授。

现有的步态识别研究主要利用二值化人体轮廓序列或人体细粒度解析序列来编码人在行走过程中的形状和动态。人体轮廓具有较高的分割质量和对环境变化的鲁棒性,但其低信息熵可能导致次优的性能。相比之下,人体解析提供了细粒度的分割,具有更高的信息熵,但分割质量可能因复杂环境而恶化。为了充分挖掘人体轮廓和人体解析的各自优势并克服它们的局限性,本文提出了一种新颖的跨粒度对齐步态识别方法,名为XGait,以释放不同粒度之间步态表征的潜力。为了实现这一目标,XGait首先包含两个骨干编码器,分别将轮廓序列和解析序列映射到两个潜在空间。此外,为了探索两种特征之间的互补知识,本文在两个编码器之后设计了全局跨粒度对齐模块(GCM)和局部跨粒度对齐模块(PCM)。其中,GCM旨在通过利用轮廓的全局特征来提高解析特征的质量,而PCM则利用解析序列中的高信息熵来协调轮廓特征和解析特征之间的动态关系。此外,为了有效地指导两种不同粒度特征在部位级的对齐,本文还提出了一种可学习式人体解析划分机制。最后,在两个大规模的步态数据集Gait3D和CCPG上进行的全面实验,验证了所提出的XGait方法的优越性,即使在遮挡和换衣等挑战性的场景下,依旧能学习到鲁棒的步态特征。

 

image.png 

 

杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生100余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于通信、自动化、计算机、电子等学院。


联系我们

联系人:孙老师

电话:0571-86878691

工作电话:0571-86878691

电子邮箱:syq@hdu.edu.cn

智能信息处理实验室

浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学