PdfBox - 无法从pdf中提取一些文本

时间:2016-12-04 17:08:01

标签: java pdf pdfbox

我正在尝试使用pdfbox从pdf中提取文本。但是我无法从表中提取所有文本。见下图(从pdf剪下)

enter image description here

(某些机密文字已突出显示)

我可以从第一个表格(橙色)和第三个表格(一般信息一个)中获取文本。但我无法从第二张表中提取任何内容。

在输出中,我只看到第1和第3个表的输出之间的几个空行。

这是我的代码。

PDDocument doc = PDDocument.load(new File("...."));
PDFTextStripper pdfStripper = new PDFTextStripper();
String text = pdfStripper.getText(doc);
System.out.println(text);
doc.close();

有任何意见或建议吗?

0 个答案:

没有答案