试图让Tess4J工作

时间:2018-08-26 07:14:58

标签: java ocr tesseract tess4j

到目前为止,我一直在尝试使Tess4J在NetBeans上运行,但未成功。我在这里关注该教程:-http://tess4j.sourceforge.net/tutorial/

我已经一字不漏地跟随它,但是却收到此错误消息:-

”打开数据文件./tessdata/eng.traineddata时出错 请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录的父目录。 加载语言“ eng”失败 Tesseract无法加载任何语言!”

有人可以告诉我这是什么意思,以及如何纠正它?

我在这里有NetBeans中该项目的屏幕截图:-

enter image description here

3 个答案:

答案 0 :(得分:0)

环境变量中缺少其他必需文件。

我们可以在链接的说明页面上看到:

  

由于DLL是使用Visual Studio 2015/2017构建的,因此请确保   您具有Visual C ++ 2015可再发行组件或VC ++ 2017可再发行组件   已安装。

解决问题的最快方法是确保已安装VC ++ 2017 Redistributable。

或者,您可以在其他位置获得所需的文件,然后将其手动添加到项目位置或类路径中的其他位置。

编辑:如果您不在Windows计算机上,或者只是想完全构建该库,请参见此处:https://github.com/tesseract-ocr/tesseract/wiki/Compiling

答案 1 :(得分:0)

设置数据完整路径,如下所示:

process.setDatapath("F:/Jar/Tess4J-3.4.8-src/Tess4J/tessdata");

或将tessdata文件放在项目根目录中。应该没问题。

答案 2 :(得分:0)

ITesseract 实例 = new Tesseract();
instance.setDatapath("C:\Users\Tux\Documents\tessdata");

这对我有用。您可以将语言文件放在“tessdata”文件夹中。你可以在任何地方创建 'tessdata' 文件夹