我收到了“压缩PDF”文件的版本,其中顶级PDF包含子PDF。
顶级PDF主要用作容器。包装在Adobe Reader中并不总是很明显(例如,当使用pdftk来打包链接时不显示)。我可以通过谷歌搜索这个术语,也不会在2012年的书中找到它(“Whittington”,“PDF Explained”,O'Reilly)。
这是PDF的标准部分吗?如果是这样,我会感激指针。 PDFBox可以分析一下吗?
答案 0 :(得分:2)
关于使用PDF作为容器文件格式是否是PDF的标准部分的问题:
是的,确实如此。 ISO 32000-1:2008在第7.11.4节嵌入式文件流中描述了它。
最突出的是与某些文档页面相关联的文件,请参阅12.5.6.15,文件附件注释,以及通过PDF文档中的EmbeddedFiles条目(PDF 1.4)与整个文档相关的文件名称字典(参见7.7.4,名称字典)。
@ JesseGood在PDFBox网站上与PDF File Specification的链接解释了如何处理后者。
我对PDFBox知之甚少,因此,不知道是否允许轻松访问其他类型的附件。如果没有,您将基本上必须迭代所有页面的注释以查找文件附件注释并根据PDF规范处理内容。