标签: pdf pdfbox
我使用PDFTextStripperByArea类检索指定矩形中包含的文本取得了一些成功。但是,我抓取的一些PDF文本在页面之间的位置略有不同。我正在寻求帮助来解决这个问题。
PDFTextStripperByArea
在下面的示例中,我可以在Acrobat编辑模式下打开PDF并查看多个文本框(带有细灰线的轮廓)。我已经指出了两个我希望从中提取文本的区域(紫色和红色)。但是,我不是仅仅将文本放在矩形内部,而是喜欢重叠文本框中的所有文本。
有办法做到这一点吗?