PDFBox抛出错误:PDPageNode - 在getAllKids()中找不到孩子。可能是格式错误的PDF格式

时间:2014-02-21 21:49:22

标签: pdfbox

有没有人遇到过这个错误?做了一个快速的谷歌,几乎没有出现。

我使用MS Excel打印到PDF,当我试图从PDF文件中提取第一页时,我在PDFBox中收到此错误。我可以使用默认的预览功能在Mac上查看PDF文件。

这是抛出错误的PDF:https://www.dropbox.com/s/owoxicr137iaduz/malformed.pdf

1 个答案:

答案 0 :(得分:1)

您没有提供代码,但我认为您可能在保存新文档之前关闭了文档。

示例(不工作):

PDDocument document = PDDocument.load(new File("..."));
PDDocument newDocument = new PDDocument();

// insert page from document into newDocument

document.close();
newDocument.save(new File("...")); // Causes the error

示例(工作):

PDDocument document = PDDocument.load(new File("..."));
PDDocument newDocument = new PDDocument();

// insert page from document into newDocument

newDocument.save(new File("...")); // No error
document.close();