我正在使用Tesseract来处理PDF文件,所以我想使用库而不是外部可执行文件。
我开始下载完整的Tesseract源代码并着眼于构建它。可悲的是,标准资源不具备在非Linux平台上构建的任何方法,在我的案例中是Windows。有这样做的方法,我看了看。
首先,VS2008版本没有。我知道它需要Leptonica,但我认为我之后会解决这个问题并尝试构建现有代码。失败"致命错误C1083:无法打开包含文件:' allheaders.h':没有这样的文件或目录"。在这个阶段与Leptonica无关,它根本不起作用。
即使我能够超越它,我也必须构建Leptonica,这需要使用GNU工具,因此需要安装Cygwin,所以我放弃了。我有一个MingW instatllation,(我从来没有设法让Cygwin以一种可用的方式工作)但我不太热衷于搞乱这么复杂和脆弱的构建。
所以我决定只使用某些灵魂所创造的预先构建的二进制文件。从code.google.com下载。现在我需要考虑使用代码,所以下一个显而易见的步骤是Tesseract API示例,它表明它需要" tesseract-ocr-3.02.02-win32-lib-include-dirs.zip",没问题,因为我现在已经有了。
关于API示例想要放置文件的位置没有真正的线索,但有点麻烦的是将它们放在适当的位置。按下构建和&#34;致命错误C1083:无法打开包含文件:&#39; allheaders.h&#39;:没有这样的文件或目录&#34;,就像尝试从源代码构建Tesseract一样..... < / p>
确实没有这样的档案。
那么,这个文件在哪里?
答案 0 :(得分:3)
我前段时间也努力让它在windows下工作,然后我找到了这个git存储库:https://github.com/charlesw/tesseract-vs2012
它包括所有需要的外部库(因为Tesseract需要Leptonica,但Leptonica也需要外部库来处理不同的图像格式),并且与vs 2013一起工作也很好。
答案 1 :(得分:2)
好的,现在我看到allheaders.h是Leptonica的一部分。仍然让我想知道为什么Tesseract预建库要求我有Leptonica可用,我本来期望它是内置的,我想它不是。