Double-bit Quantization and Index Hashing for Nearest Neighbor Search

Hongtao Xie, Yongdong Zhang, Han Deng, Chenggang Yan, and Zhineng Chen

        由于二进制代码存储有效且计算速度快,因此在大规模数据库中将实值数据压缩为二进制代码以进行最近邻(NN)搜索已成为一种趋势。但是,使用二进制代码进行NN搜索会导致检索准确性降低。为了增加现有散列函数二进制代码的可辨识性,在本文中,我们提出了一种双位量化和索引散列的框架,用于有效的NN搜索。我们框架的主要贡献是:首先,设计了一种新颖的双比特量化(DBQ),为每个维度分配更多比特,以获得更高的检索精度;第二,提出双位索引散列(DBIH)以有效地索引由DBQ生成的二进制代码;第三,提出了DBQ二进制码的加权距离测量,以对来自DBIH的搜索结果进行重新排序。三个基准数据库的实证结果证明了我们的框架在检索准确性和查询效率方面优于现有方法的优越性。具体来说,我们观察到大多数情况下精度绝对提高10%-25%,并且与传统的二进制嵌入方法和线性扫描相比,查询速度分别提高了30倍以上。

       该成果发表于IEEE Transactions on Multimedia 期刊。

Double-Bit Quantization and Index Hashing for  Nearest Neighbor Search.pdf


联系我们

联系人:孙老师

电话:0571-86878691

工作电话:0571-86878691

电子邮箱:syq@hdu.edu.cn

智能信息处理实验室

浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学