智能信息处理实验室-新闻

我校颜成钢教授团队成果被多媒体领域顶级国际学术会议ACM MM接收

近日，自动化学院（人工智能学院）颜成钢教授团队以杭电为第一单位的论文Gait Recognition in the Wild with Multi-hop Temporal Switch被多媒体领域顶级会议ACM Multimedia（CCF A类会议）录用。该文章的作者依次为郑锦凯、刘鑫辰、古晓艳、孙垚棋、淦创、张继勇、刘武、颜成钢。

本文第一作者郑锦凯表示，现有的步态识别研究主要集中于实验室场景。但是人们生活在现实世界中，真实场景下的步态识别是一个更加需要关注的实际问题，近年来引起了多媒体领域和计算机视觉界的广泛关注。目前的方法在实验室场景下获得了极高的性能，但在最近提出的真实场景步态数据集上的准确性却很不理想，因为这些方法很难建模非受控场景（即真实场景）下的步态时序变化。本文提出了一种新的多级时间跳变方法，以实现对真实场景中步态模式的有效时间建模。具体地说，我们设计了一种新的步态识别网络——多跳时间跳变网络(MTSGait)，它可以同时学习空间特征和多尺度时间特征。与现有的使用三维卷积进行时间建模的方法不同，我们的方法通过二维卷积对步态序列的时间动力学进行建模。该方法与基于三维卷积的模型相比，只需要较少的模型参数就能达到较高的识别准确率，同时降低了模型的优化难度。该方法通过对二维卷积核的具体设计，消除了相邻帧间的特征不对齐问题。此外，本文还提出了一种新的步态数据采样策略，即非循环连续采样，使得模型能够学习到更鲁棒的步态时间特征。最后，本文提出的方法在GREW和Gait3D两大公开的真实场景步态数据集上取得了显著提升。

郑锦凯同学是杭电智能信息处理实验的硕博连读研究生。他专注于步态识别和计算机视觉领域的研究，此前以第一作者身份在计算机视觉顶级会议CVPR（CCF A类）和ISCAS国际学术会议上发表过论文，并荣获2021年度IEEE MSA-TC最佳论文提名奖。

杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师16名，含3位国家级人才及4位省级人才。现有硕博生87名，毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中科院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学、京东AI研究院等等)联合培养制，长期致力于智能信息处理方面的研究，主要研究方向包括：机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队，拥有自由开放的学术氛围和国际前沿的研究方向，可以在多个学院招生，包括但不限于自动化、计算机、电子、通信等学院。

转自杭电新闻原文链接 https://www.hdu.edu.cn/news/important_29729?page=1&year=2022&month=