Question

我试图在我的项目中使用Tess4J从图像中提取文本。我尝试运行OCR时收到以下错误：线程“main”中的异常java.lang.Error：内存访问无效

    try {
        File imageFile = new File("example4.jpg");
        Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping
        //Tesseract1 instance = new Tesseract1();
        String result = instance.doOCR(imageFile);
        System.out.println(result);
    } catch (Exception e) {
        e.printStackTrace();
    }

Answer 1

当我设置解决问题的数据路径时，你可以设置我遇到同样问题的数据路径试试这个

instance1.setDatapath（＆＃34; d：//Hotel_project//Tess4J-1.2-src//Tess4J//tessdata"）;

Answer 2

您必须定义要使用的训练数据的数据路径。如果你没有指定语言，它会认为它是eng。

例如，您的项目路径是PROJECT，您的训练数据是PROJECT / data / tessdata / eng.traineddata

tess.setDatapath("data");
tess.setLanguage("eng");

请记住，“tessdata”不会出现在您指定的路径中

Answer 3

如果您在32位JVM上运行

请尝试使用Tesseract1 instance = new Tesseract1（）;

而不是使用 Tesseract instance = Tesseract.getInstance（）;

Tess4J：内存访问无效

3 个答案: