tess4j doOCR中矩形的坐标是什么?

时间:2017-02-08 15:37:09

标签: tesseract tess4j

我试图使用tess4j扫描多页PDF文件。我使用以下代码:

PdfUtilities.splitPdf(imageFile, outputFile, startPage, endPage);
List<IIOImage> imageList = ImageIOHelper.getIIOImageList(outputFile);
String result = instance.doOCR(imageList, null);

然而,由于速度问题,我只对每页扫描上半部分(实际上,甚至更少,但为了论证)感兴趣。 API指定我当前传递的位置null我可以传递Rectangle rect,但我没有看到矩形坐标引用的内容。如果这有任何不同,PDF来自不同的提供商。

1 个答案:

答案 0 :(得分:1)

它指定图像边界内的区域,图像的左上角有(0,0)。

http://tess4j.sourceforge.net/docs/docs-3.0/