tesseract ocr multipage pdf挂起

时间:2011-07-12 06:10:57

标签: pdf ocr tesseract multipage

我们正在使用Tesseract的Java库,称为Tess4j,将PDF文件转换为文本。 它与Tiff文件以及一页PDF文件很好地配合使用。但是对于多页PDF,它会生成输出文件,当涉及到最后一页时,控件似乎没有回到调用doOCR调用的原始应用程序。只是在没有做任何事情的情况下停留在那里。 这是一个本机调用没有返回的问题。我没有任何线索,

如果有问题,请尽快通知我。

问候
Vish

1 个答案:

答案 0 :(得分:0)

Tess4J支持多页PDF和多页TIFF。用单元测试用例中的PDF文件替换并试一试。