有没有办法使用pdfbox从现有的pdf中读取页眉,页脚,水印图像/文本?

时间:2014-04-02 09:18:38

标签: java pdf pdfbox

基本上我想要执行PDF验证,我的pdf涉及页眉,页脚,水印等。我需要知道如何使用pdfbox从现有pdf中检索上述字段?我们如何区分常规图像和水印img?是否可以通过pdfbox apis,如[Image.isWatermarkedImage()]?我看过添加这些内容的例子,但没有一个人谈到检索。

1 个答案:

答案 0 :(得分:1)

  

我想执行PDF验证,我的pdf涉及页眉,页脚,水印等。我需要知道如何使用pdfbox从现有pdf中检索上述字段?

您的问题显示了一些误解:在通用PDF文档中没有页眉,页脚,水印,只有内容。

尽管PDF规范包含标记内容以表达此类用途的机制,但此标记是可选的,因此,您通常无法预料到。

正如您所说想要执行PDF验证,但您可能会对PDF制作过程或至少在验证标准上产生一些影响。如果是这种情况,您可以尝试相应地标记这些文档部分。在这种情况下,我们可以尝试详细说明事先需要什么,以及如何查找和检查这些标记的部分。

  

我们如何区分常规图像和水印img?

比照。关于如何识别水印图像的this answer。实质上:一般来说,你无法确定它们。