PDFBox从重叠框中检索文本

时间:2017-10-12 21:57:43

标签: pdf pdfbox

我使用PDFTextStripperByArea类检索指定矩形中包含的文本取得了一些成功。但是,我抓取的一些PDF文本在页面之间的位置略有不同。我正在寻求帮助来解决这个问题。

在下面的示例中,我可以在Acrobat编辑模式下打开PDF并查看多个文本框(带有细灰线的轮廓)。我已经指出了两个我希望从中提取文本的区域(紫色和红色)。但是,我不是仅仅将文本放在矩形内部,而是喜欢重叠文本框中的所有文本。 Example PDF with regions overlapping with text boxes

有办法做到这一点吗?

0 个答案:

没有答案