Java项目中Tesseract中语言文件的位置

时间:2013-11-21 21:22:36

标签: java ocr tesseract

我在Java项目中使用Tesseract的Java包装器Tess4J,以获得土耳其语图像的OCR。该项目具有从客户端调用的Web方法。我的问题是:我应该在哪里放土耳其语数据文件?如果我把tur.traineddata文件放在项目文件夹的某个地方,Tesseract会工作吗?或者我是否必须将tesseract安装到服务器计算机并将tur.traineddata放在tessdata文件夹下?

2 个答案:

答案 0 :(得分:2)

在Tesseract类中有一个方法setDatapath(String path)你可以调用这个方法来告诉Tesseract在哪里寻找语言文件来执行ocr例如假设你的tessdata文件夹在D:\ My_Language_Files文件夹然后你必须例如,在setDatapath()方法中传递“D:\ My_Language_Files”字符串

Tesseract instance = Tesseract.getInstance(); instance.setDatapath("D:\My_Language_Files"); instance.setLanguage("eng");

答案 1 :(得分:1)

您可以将语言数据文件放在任何位置。请务必在Init方法中指定其位置,或为其设置TESSDATA_PREFIX环境变量。