应用错误收集

我有一个经过处理的扫描图像，正尝试对其执行OCR。将图像转换为二进制并缩放后，图像看起来像1，但是Tesseract无法检索出其余图像中突出的字母数字。

预期结果将是“ 123112 ”，但我得到了诸如“ * 53”;。gxuimSaabz'ssiiämFi之类的胡言乱语？？？？ 1231 12 5 *”。 Tessaract通过JNI（在Java 8中实现）实例化如下：

            instance = new Tesseract();  // JNA Interface Mapping
            instance.setLanguage("swe");
            instance.setOcrEngineMode(ITessAPI.TessOcrEngineMode.OEM_TESSERACT_ONLY);

有什么想法可以改善结果吗？

改善扫描图像的Tesseract结果

0 个答案: