近日,自动化学院(人工智能学院)颜成钢教授团队以杭电为第一单位的论文Gait Recognition in the Wild with Multi-hop Temporal Switch被多媒体领域顶级会议ACM Multimedia(CCF A类会议)录用。该文章的作者依次为郑锦凯、刘鑫辰、古晓艳、孙垚棋、淦创、张继勇、刘武、颜成钢。
本文第一作者郑锦凯表示,现有的步态识别研究主要集中于实验室场景。但是人们生活在现实世界中,真实场景下的步态识别是一个更加需要关注的实际问题,近年来引起了多媒体领域和计算机视觉界的广泛关注。目前的方法在实验室场景下获得了极高的性能,但在最近提出的真实场景步态数据集上的准确性却很不理想,因为这些方法很难建模非受控场景(即真实场景)下的步态时序变化。本文提出了一种新的多级时间跳变方法,以实现对真实场景中步态模式的有效时间建模。具体地说,我们设计了一种新的步态识别网络——多跳时间跳变网络(MTSGait),它可以同时学习空间特征和多尺度时间特征。与现有的使用三维卷积进行时间建模的方法不同,我们的方法通过二维卷积对步态序列的时间动力学进行建模。该方法与基于三维卷积的模型相比,只需要较少的模型参数就能达到较高的识别准确率,同时降低了模型的优化难度。该方法通过对二维卷积核的具体设计,消除了相邻帧间的特征不对齐问题。此外,本文还提出了一种新的步态数据采样策略,即非循环连续采样,使得模型能够学习到更鲁棒的步态时间特征。最后,本文提出的方法在GREW和Gait3D两大公开的真实场景步态数据集上取得了显著提升。
郑锦凯同学是杭电智能信息处理实验的硕博连读研究生。他专注于步态识别和计算机视觉领域的研究,此前以第一作者身份在计算机视觉顶级会议CVPR(CCF A类)和ISCAS国际学术会议上发表过论文,并荣获2021年度IEEE MSA-TC最佳论文提名奖。
杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师16名,含3位国家级人才及4位省级人才。现有硕博生87名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中科院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学、京东AI研究院等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于自动化、计算机、电子、通信等学院。
转自 杭电新闻 原文链接 https://www.hdu.edu.cn/news/important_29729?page=1&year=2022&month=
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学