我正在尝试使用pdfbox
从pdf中提取文本。但是我无法从表中提取所有文本。见下图(从pdf剪下)
(某些机密文字已突出显示)
我可以从第一个表格(橙色)和第三个表格(一般信息一个)中获取文本。但我无法从第二张表中提取任何内容。
在输出中,我只看到第1和第3个表的输出之间的几个空行。
这是我的代码。
PDDocument doc = PDDocument.load(new File("...."));
PDFTextStripper pdfStripper = new PDFTextStripper();
String text = pdfStripper.getText(doc);
System.out.println(text);
doc.close();
有任何意见或建议吗?