从没有XFA格式的PDF文档中读取数据

时间:2017-08-09 08:53:14

标签: pdf itext pdf-parsing

我使用iText阅读包含XFA表单的PDF文档。 我将其转换为XML,从XML读取数据并将其插入数据库。 但是,如果我在PDF中没有XFA表单,那么我如何才能有效地从PDF中读取数据?

1 个答案:

答案 0 :(得分:-1)

这取决于您的期望。

  • 您可以使用文本提取来检索特定页面上的所有文本。您如何处理文本取决于您。 (例如正则表达式)

  • 您还可以选择使用pdf2Data,这是一个iText7插件,可让您将文档与模板进行匹配。 pdf2Data似乎很合适,因为它生成XML文件作为输出。

有关pdf2Data的更多信息,请访问http://itextpdf.com/itext7/pdf2Data