我在最近的项目中正在运行tess4j 4.3.0。我正在尝试从TIF图像/ BufferedImages中获取文本。当我要提取文本时,此错误发生在我要提取的第四张图片上。
我已经尝试更改语言环境。在某些配置下,它运行了约200张图像,但随后崩溃了。
我的代码:
public String getContentFromFile()` {
try {
ITesseract instance = new Tesseract();
instance.setDatapath("tessdata");
instance.setLanguage("eng");
String result = instance.doOCR(image);
this.content = result;
return result;
}
catch (Exception e) {
System.err.println(e.getMessage());
this.content = e.getMessage();
return "";
}
}
错误:
contains_unichar_id(unichar_id):错误:声明失败:在文件../ccutil/unicharset.h中,第513行