野外的OCR-图像预处理

时间:2018-07-20 20:00:51

标签: python opencv image-processing tesseract

我正在使用pyOCR和tesseract 4.0.0识别图像中的文本。它工作得很好,但通常无法正确识别“ i”和“ l”。

我的预处理步骤是:

  • cv2.threshold(cv2.THRESH_BINARY_INV)
  • cv2.dilate(binimage,(3,3),迭代次数= 1)

我还尝试转换为HSV,仅在绿色通道上设置阈值,使其腐蚀,模糊和歪斜,但这似乎会使结果恶化。

original image after pre-processing

如何更好地预处理图像以识别Takabari而不是Takabarl

0 个答案:

没有答案