我对Tess4J很新,所以我的知识有点受限。我目前正在使用Tess4j对已经使用OpenCV应用了阈值的图像执行OCR。我使用OTSU对图像进行阈值处理,并裁掉大部分噪音,但Tesseract似乎根本无法读取数字。我已经读到尺寸可以改变识别,但即使我缩放图像它似乎也不起作用。是否还需要对Image进行更多操作或使用其他.traindata进行OCR?
这是我对Tess4J的OCR的代码。
public static void main(String[] args) {
File imageFile = new File("newim.TIFF");
Tesseract instance = new Tesseract(); // JNA Interface Mapping
instance.setDatapath("workspace/Tess4J/tessdata");
instance.setLanguage("Interstate");
try {
String result = instance.doOCR(imageFile);
System.out.println(result);
} catch (TesseractException e) {
System.err.println(e.getMessage());
}
}
结果:" EEEH"