应用错误收集

野外的OCR-图像预处理

时间：2018-07-20 20:00:51

标签： python opencv image-processing tesseract

我正在使用pyOCR和tesseract 4.0.0识别图像中的文本。它工作得很好，但通常无法正确识别“ i”和“ l”。

我的预处理步骤是：

cv2.threshold（cv2.THRESH_BINARY_INV）
cv2.dilate（binimage，（3,3），迭代次数= 1）

我还尝试转换为HSV，仅在绿色通道上设置阈值，使其腐蚀，模糊和歪斜，但这似乎会使结果恶化。

如何更好地预处理图像以识别Takabari而不是Takabarl

0 个答案:

没有答案