我在Java项目中使用Tesseract的Java包装器Tess4J,以获得土耳其语图像的OCR。该项目具有从客户端调用的Web方法。我的问题是:我应该在哪里放土耳其语数据文件?如果我把tur.traineddata文件放在项目文件夹的某个地方,Tesseract会工作吗?或者我是否必须将tesseract安装到服务器计算机并将tur.traineddata放在tessdata文件夹下?
答案 0 :(得分:2)
在Tesseract类中有一个方法setDatapath(String path)你可以调用这个方法来告诉Tesseract在哪里寻找语言文件来执行ocr例如假设你的tessdata文件夹在D:\ My_Language_Files文件夹然后你必须例如,在setDatapath()方法中传递“D:\ My_Language_Files”字符串
Tesseract instance = Tesseract.getInstance();
instance.setDatapath("D:\My_Language_Files");
instance.setLanguage("eng");
答案 1 :(得分:1)
您可以将语言数据文件放在任何位置。请务必在Init
方法中指定其位置,或为其设置TESSDATA_PREFIX
环境变量。