我正在使用Java中的PDFBox库来阅读pdf表单并识别每个字段中的字段和值(请参阅下面的代码)。
System.out.println("- - - - - - - - -");
File file = new File("file.pdf");
PDDocument doc = PDDocument.load(file);
PDDocumentCatalog catalog = doc.getDocumentCatalog();
PDAcroForm form = catalog.getAcroForm();
PDFieldTree fields = form.getFieldTree();
for (PDField field : fields) {
String name = field.getPartialName();
Object value = field.getValueAsString();
System.out.print(name);
System.out.print(" -> ");
System.out.print(value);
System.out.println();
}
System.out.println("- - - - - - - - -");
代码对this pdf没有任何问题,并显示:
- - - - - - - - -
test -> 1234
- - - - - - - - -
但不适用于this pdf,仅显示:
- - - - - - - - -
- - - - - - - - -