近日,颜成钢教授团队以杭电为第一单位的论文PANDORA: A Panoramic Detection Dataset for Object with Orientation被计算机视觉领域顶级学术会议ECCV 2022接收,该研究的合作单位还有中科院计算所和华为诺亚方舟实验室。论文第一作者是我校“智能信息处理实验室”(HDU IIPLab)的博士研究生徐杭。 ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ,每隔两年举办一次,是计算机视觉三大会议(另外两个是ICCV和CVPR)之一。本届大会的有效投稿量达5803篇,接收论文1650篇,接收率约为28%。
全景视觉数据是通过全景数据采集设备采集得到的全景图像或全景视频,它包含了空间中全方位360度的视觉信息,具有“视野全、可交互、沉浸感强”的特点。这使得其在很多领域都得到了很好的应用,如虚拟现实、机器人、视频监控等。但是,由于全景视觉数据表示的是空间中整个球面360度的视觉信息,需要采用特定的投影方式将球面投影到平面上。等距柱面投影目前已经成为事实上的全景图像投影标准,这种投影方式使得物体在最后存储的图像中会产生畸变,并且畸变程度和基本形状与物体在球面上所处的纬度位置相关。从而导致全景视觉数据的特征表达与传统视觉数据的特征表达产生明显的差异,为计算机视觉任务带来巨大的挑战。本研究工作专注于全景视觉物体检测领域,为该领域建立了一个基准。具体来说,首先,结合全景视觉数据的特点,论文提出了一种全新的全景物体检测的标注方式RBFoV和IoU计算方法。其次,根据这种新的标注方式制作了一个更加合理的全景物体检测数据集PANDORA。 最后,在新的数据集上,提出了一种全景物体检测方法R-CenterNet。相比于之前的方法,该方法达到了最佳的性能。相信本文提出的一整套全景物体检测新基准,将为该领域带来全新的进展。
杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师16名,含3位国家级人才及4位省级人才。现有硕博生87名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中科院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学、京东AI研究院等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于自动化、计算机、电子、通信等学院。
转自 杭电新闻 原文链接 https://www.hdu.edu.cn/news/important_29736?page=1&year=2022&month=
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学