我们正在使用Tesseract的Java库,称为Tess4j,将PDF文件转换为文本。 它与Tiff文件以及一页PDF文件很好地配合使用。但是对于多页PDF,它会生成输出文件,当涉及到最后一页时,控件似乎没有回到调用doOCR调用的原始应用程序。只是在没有做任何事情的情况下停留在那里。 这是一个本机调用没有返回的问题。我没有任何线索,
如果有问题,请尽快通知我。
问候
Vish
答案 0 :(得分:0)
Tess4J支持多页PDF和多页TIFF。用单元测试用例中的PDF文件替换并试一试。