如何在tess4j中捕获或修复unichar错误?

时间:2019-07-05 09:55:33

标签: java tesseract tess4j

我在最近的项目中正在运行tess4j 4.3.0。我正在尝试从TIF图像/ BufferedImages中获取文本。当我要提取文本时,此错误发生在我要提取的第四张图片上。

我已经尝试更改语言环境。在某些配置下,它运行了约200张图像,但随后崩溃了。

我的代码:

public String getContentFromFile()` {

try {
 ITesseract instance = new Tesseract(); 
 instance.setDatapath("tessdata"); 
 instance.setLanguage("eng");
 String result = instance.doOCR(image);
 this.content = result;
 return result;
}  

catch (Exception e) {
        System.err.println(e.getMessage());
        this.content = e.getMessage();
        return "";
    }
}

错误:

  

contains_unichar_id(unichar_id):错误:声明失败:在文件../ccutil/unicharset.h中,第513行

0 个答案:

没有答案