近日,第25届ACM国际多媒体会议(ACM International Conference on Multimedia,简称ACM MM)在美国硅谷举行。我校自动化学院大四学生涂云斌撰写的论文“Video Description with Spatial-Temporal Attention”被大会录用,并应邀参会作报告。
ACM MM于1993年首次召开,每年举行一次,已经成为多媒体领域顶级学术会议,也是中国计算机学会推荐的A类国际学术会议。本届大会共收到来自世界各地的有效投稿论文684篇,最终确定录用189篇,录用率为27.63%,其中学生作为第一作者的,绝大部分为各高校在读博士和硕士研究生。
会议期间,涂云斌在Fast Forward Session中向大会作了有关论文内容的报告,并和与会人员进行了交流,分享团队研究成果,其研究工作受到参会人员的广泛关注。
涂云斌的论文主要研究当前计算机视觉领域新兴方向——视频内容自动语言描述,让计算机像人类一样,能够看懂一个视频并能对视频内容用符合人类语言习惯的句子进行描述。该论文尝试提出首先在每一帧图像的空间结构上选择关键区域,再在整个视频的帧流上选择关键帧的空间+时间注意力模型,以解决对细节物体的识别缺失或识别错误的问题,从而大大提高了描述结果的准确性。
据悉,涂云斌同学是自动化学院IIPL实验室成员,该实验室由颜成钢教授领衔,与美国佐治亚理工大学、美国北卡罗来纳大学教堂山分校、美国中佛罗里达大学、中国科学院、清华大学、微软亚洲研究院等国内外多家科研院所有长期密切的合作,近年来培养出多名优秀学生,学院2016、2017年度的8位本科生国家奖学金获得者中有4位出自该实验室。(自动化学院)
(本文转自杭州电子科技大学 | 新闻 | 杭电要闻,原文请见http://www.hdu.edu.cn/news/important_23700)
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学