我有PDF格式,如图所示。FORM_PDF
在Java中使用PDFBox我已经检索了表单字段的文本。 我的代码:
File file = new File("example.pdf");
PDDocument doc = PDDocument.load(file);
PDDocumentCatalog catalog = doc.getDocumentCatalog();
PDAcroForm form = catalog.getAcroForm();
PDFieldTree fields = form.getFieldTree();
for (PDField field : fields) {
Object value = field.getValueAsString();
String name = field.getPartialName();
System.out.print(name);
System.out.print(" = ");
System.out.print(value);
System.out.println();
}
输出:
我想在下面检索
as
由于上面是表单字段,所以很容易检索所有字段。我想要提取表单的标签,因为我想要映射它们。
请帮助。 非常感谢。