如何在应用阈值后使Tess4J准确读取TIFF图像?

时间:2017-09-23 00:27:35

标签: java ocr tesseract tess4j

我对Tess4J很新,所以我的知识有点受限。我目前正在使用Tess4j对已经使用OpenCV应用了阈值的图像执行OCR。我使用OTSU对图像进行阈值处理,并裁掉大部分噪音,但Tesseract似乎根本无法读取数字。我已经读到尺寸可以改变识别,但即使我缩放图像它似乎也不起作用。是否还需要对Image进行更多操作或使用其他.traindata进行OCR?

这是我对Tess4J的OCR的代码。

public static void main(String[] args) {
    File imageFile = new File("newim.TIFF");
    Tesseract instance = new Tesseract(); // JNA Interface Mapping
    instance.setDatapath("workspace/Tess4J/tessdata");
    instance.setLanguage("Interstate");


    try {
        String result = instance.doOCR(imageFile);
        System.out.println(result);
    } catch (TesseractException e) {
        System.err.println(e.getMessage());
    }
}

Image I'm trying to do OCR on

结果:" EEEH"

0 个答案:

没有答案