消除字符识别算法中多余边界框的有效方法

时间:2019-03-21 00:53:07

标签: python algorithm opencv ocr

我正在研究如何同时应用不同的二值化算法来改善OCR系统的字符分割。 本质上,我应用了许多具有不同参数的不同算法,并使用CCA分别从每个算法中提取候选对象。想法是,不同的算法会检测图像中的不同字符,并且将它们全部组合在一起应产生更准确的结果。 输出如下图所示:

example

# Where each color represents the result of a different binarization algo and 
# all bboxes are stored in the same array in format (topleft, bottomright) 
boxes = [box1,box2,...,box_n]

我现在想做的是在将候选区域发送到识别阶段之前消除多余的边界框(类似于ML算法中的非最大抑制,除非我没有置信度分数)。有没有一种有效的方法可以使我不必遍历所有可能的盒子? 自从我使用Python以来,速度是一个重要因素,我希望它对于实时分析是可行的。

此实验基于以下文章: 用于车牌字符分割的二值化方法的最佳组合 尹永宇,潘九大,何sub允,李宰妍,金在宏

0 个答案:

没有答案