我试图使用tess4j扫描多页PDF文件。我使用以下代码:
PdfUtilities.splitPdf(imageFile, outputFile, startPage, endPage);
List<IIOImage> imageList = ImageIOHelper.getIIOImageList(outputFile);
String result = instance.doOCR(imageList, null);
然而,由于速度问题,我只对每页扫描上半部分(实际上,甚至更少,但为了论证)感兴趣。 API指定我当前传递的位置null
我可以传递Rectangle rect
,但我没有看到矩形坐标引用的内容。如果这有任何不同,PDF来自不同的提供商。