阅读flattened PDF java中的内容

时间:2018-06-11 17:06:32

标签: pdf itext pdfbox pdf-java-toolkit

我正在尝试从一组PDF文件中读取内容。 PDF文件是扁平的,即它们没有任何表单字段或交互性。最初,所有这些PDF都具有表单字段/交互性,后来被展平。目前我只有扁平的版本。

我的目标是在展平前检索输入到文本字段中的值和复选框(最重要的是)。

我已经探索了一些Java库,如pdfbox和itext,但所有示例似乎都在处理带有表单字段的PDF。我还探索了一个OMR库来提取复选框的值,但它在像素级别工作,我不能在阅读时硬编码复选框的位置,因为它有时可能会有所不同。

有没有办法实现这个目标?任何建议都非常感谢。

谢谢!

0 个答案:

没有答案