我有一个经过处理的扫描图像,正尝试对其执行OCR。将图像转换为二进制并缩放后,图像看起来像1,但是Tesseract无法检索出其余图像中突出的字母数字。
Processed image to perform OCR on
预期结果将是“ 123112 ”,但我得到了诸如“ * 53”;。gxuimSaabz'ssiiämFi之类的胡言乱语???? 1231 12 5 *”。 Tessaract通过JNI(在Java 8中实现)实例化如下:
instance = new Tesseract(); // JNA Interface Mapping
instance.setLanguage("swe");
instance.setOcrEngineMode(ITessAPI.TessOcrEngineMode.OEM_TESSERACT_ONLY);
有什么想法可以改善结果吗?