标签: python opencv image-processing tesseract
我正在使用pyOCR和tesseract 4.0.0识别图像中的文本。它工作得很好,但通常无法正确识别“ i”和“ l”。
我的预处理步骤是:
我还尝试转换为HSV,仅在绿色通道上设置阈值,使其腐蚀,模糊和歪斜,但这似乎会使结果恶化。
如何更好地预处理图像以识别Takabari而不是Takabarl