'W'上的字符分段失败

时间:2017-11-14 10:58:17

标签: opencv ocr contour

我正在使用OpenCV进行包含任意字符和数字的打印代码的OCR。我的管道涉及阈值处理,去噪,渐变形态,然后找到轮廓,以便在每个字母周围放置一个边界框。

除非代码中出现“W”,否则效果非常好。它通常会放置2个或3个边界框,使得预测为“VAV”或“VV”,这实际上是我疲惫时自己的眼睛可能犯的错误。

有没有人有任何想法如何最好地解决这个问题?我可以相当肯定,许多代码中都出现了“W”,需要对其进行适当的分割。谢谢你的帮助!

2 个答案:

答案 0 :(得分:2)

我找到了一个有效的解决方案,至少在我的情况下。我迭代地计算相邻边界框的相对重叠,组合重叠大于指定阈值的边界框(在我的情况下为0.15)。这对我的数据非常有效。

以裁剪为例:

enter image description here

enter image description here

答案 1 :(得分:0)

在找到轮廓之前,尝试在图像上运行形态膨胀。这将帮助您将字母W的所有部分合并为单个blob,从而防止将其识别为多个字母。