改善扫描图像的Tesseract结果

时间:2020-03-02 10:09:51

标签: java image-processing ocr tesseract tess4j

我有一个经过处理的扫描图像,正尝试对其执行OCR。将图像转换为二进制并缩放后,图像看起来像1,但是Tesseract无法检索出其余图像中突出的字母数字。

Processed image to perform OCR on

预期结果将是“ 123112 ”,但我得到了诸如“ * 53”;。gxuimSaabz'ssiiämFi之类的胡言乱语???? 1231 12 5 *”。 Tessaract通过JNI(在Java 8中实现)实例化如下:

            instance = new Tesseract();  // JNA Interface Mapping
            instance.setLanguage("swe");
            instance.setOcrEngineMode(ITessAPI.TessOcrEngineMode.OEM_TESSERACT_ONLY);

有什么想法可以改善结果吗?

0 个答案:

没有答案