Hantao Yao, Shiliang Zhang, Chenggang Yan, Yongdong Zhang, Jintao Li and Qi Tian
与传统的图像分类相比,细粒度的视觉分类是一项更具挑战性的任务,因为它的目标是对属于同一物种的物体进行分类,例如,对数百只鸟类或汽车进行分类。在过去几年中,研究人员在这一主题上取得了许多成就。然而,它们中的大多数严重依赖于人工注释,例如边界框,部分注释等。人工注释的要求在很大程度上阻碍了可扩展性和应用。为了释放这种依赖性,本文提出了一种强大且具有辨别力的视觉描述,称为自动双层描述(AutoBD)。 “双层”分别表示两个互补的部分级和对象级视觉描述。 AutoBD是“自动化的”,因为它只需要训练图像的图像级标签,并且不需要任何注释来测试图像。与人类标注的部分注释相比,可以容易地获取图像级标签,从而使得AutoBD适合于大规模的视觉分类。具体地,通过识别显着地表示视觉独特性的局部区域来提取部分级描述。从使用共定位算法生成的对象边界框中提取对象级描述。尽管仅使用图像级标签,AutoBD优于最近两项公共基准的研究,即CUB-200-2011的分类准确率分别达到81.6%和Car-196分别达到88.9%。在大型Birdsnap数据集中,AutoBD实现了68%的准确率,这是目前我们所知的最佳性能。
该成果发表于IEEE Transactions on Image Processing期刊。
AutoBD Automated Bi-Level Description for Scalable Fine-Grained Visual Categorization.pdf
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学