使用Apache PDFBox从PDF中删除ID字段

时间:2014-06-03 14:31:32

标签: pdf pdfbox

我需要与使用iText创建的PDF文档进行比较。我实际上设法比较了这些文件,但我却遇到了一些微小的差异。

在像Notepad ++这样的编辑器中打开PDF时,我可以看到有类似的东西拖到文件的末尾:

/Root 1 0 R
/ID [<Some ID here> <Some other ID here>]

正如我在这里发现的那样(What is the ID field in a pdf file?),这个元素属于名为&#34; Trailer&#34;。

我可以访问和修改这个&#34;字段&#34;使用Apache PDFBox?

1 个答案:

答案 0 :(得分:0)

以下代码段对我来说很好。

PDDocument doc = PDDocument.load(pdf);
COSArray cosArray = doc.getDocument().getDocumentID();
// Clear or set whatever values...
cosArray.clear();
doc.getDocument().setDocumentID(cosArray);