Chenggang Yan, Hongtao Xie, Jianjun Chen, Yongdong Zhang and Qionghai Dai
具有复杂背景的图像中的维吾尔文本定位对于许多应用来说是具有挑战性但重要的任务。 通常,图像中的维吾尔字符由具有均匀特征的笔划组成,并且它们在颜色,强度和纹理方面与背景不同。 基于这些差异,我们提出了一种快速且特定于行程的FASTroke关键点提取器。 与常用的MSER检测器相比,FASTroke产生的组件数量少于两倍,并且识别出至少10%的字符数。 虽然一行中的字符通常具有统一的特征,例如大小,颜色和笔划宽度,但是基于组件相似性的聚类在没有组件级别分类的情况下呈现。 通过合并组件级分类器,同时大幅降低计算成本,不会产生额外错误。 实验表明,该方法可以在UICBI-500基准数据集上实现最佳性能。
该成果发表于IEEE Transactions on Multimedia期刊。
A Fast Uyghur Text Detector for Complex Background Images.pdf
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学