我目前正在开发一种在pdf文档上应用和验证数字签名的工具。据我所知,pdf文档中的每个签名都适用于AcroFields的某个版本。每次用户更改某些输入(即填写pdf表单)时,都会创建一个新版本。
我的问题是:如何从AcroFields对象中检索所有修订?如果我有这样的名字,我知道如何获得单修订版:
AcroFields fields = ...;
fields.getRevision("revision1");
但是如何检索所有修订(或至少是他们的名字)?到目前为止,我还没有在iText API和网络中找到任何内容。
我在版本2.1.7中使用iText。
谢谢和问候, 汤姆
答案 0 :(得分:11)
首先有些背景
通常,PDF文件由标题,正文,交叉引用信息和预告片组成,请参见下面的图2。更新此类PDF文件时,您可以选择
实际上,介于两者之间。例如。一些工具只是切断原始文档的交叉引用和预告片,然后添加新的或更改的主体元素,新的完整交叉引用和新的预告片,而不对任何前状态进行任何反向引用。
(从PDF规范ISO 32000-1:2008复制的图像)
如果PDF形成如图3所示,我们有手边的PDF的不同状态的历史记录,每个状态从文件的开头开始并到达并包括其中一个预告片。这些状态通常被命名为文档的修订版,文档的每个修订版显然都反映了PDF的表单信息的某些状态,我假设是您所谓的修订AcroFields 。
与您的假设相反,这些修订本身没有名称。除非您使用ID的第二部分(对于不同的修订版本应该是不同的),但AFAIK不用作iText中任何内容的名称。
预告片停止并开始下一次身体更新的确切位置存在一些不精确性。一方面,规范中即将出现一些选择(不同的可能的换行符,忽略的空格,忽略的注释行),另一方面,许多PDF生成器仍然有点超出规范。这与上面提到的完全更新和增量更新之间的中间变量相结合,有时会使得提取修订的过程有点麻烦。
有一个特殊的修订版本,可以很高的可靠性识别:签名版本,即最后一次更新包含文档集成签名的修订版本。由于文档的签名字节范围必须包含所有文档修订版,但签名本身留有差距(至少要被Adobe软件接受并符合PAdES和PDF-2标准),因此确切的结束在这种情况下的修订可以从签名信息中推断出来:
更多详情here。
您的问题的一些答案
据我所知,pdf文档中的每个签名都适用于AcroFields的某个版本。
如上所述,每个都应用于文档的某个版本,然后暗示表单数据的某个状态或“修订版”。
每次用户更改某些输入(即填写pdf表单)时,都会创建一个新版本。
不一定。如上所述,有许多中间更新方法。
仅当更改最新修订版已签名的文档的信息时,如果不删除或无效该签名,则必须进行适当的增量更新。否则,更新程序可以获取上次签名后添加的所有信息,使用他希望的任何内容创建自己的更新,并将该更新附加到文档的最后签名修订。此更新甚至可能包含多个虚拟更新块,目的是让您相信实际存在某些中间修订。
因此,只有签名的修订才能以某种方式被信任为真。 iText仅提供对此类签名修订的访问权。
我的问题是:如何从AcroFields对象中检索所有修订版?
您可以使用
提取所有已签名的文档修订InputStream revisionStream = fields.extractRevision("name");
并在单独的PdfReader
个实例中打开它们。然后,您可以通过查询为该修订打开的相应AcroFields
的{{1}}实例来访问每个签名修订的PDF表单信息。
(顺便说一句,PdfReader
参数不是修订版的名称,而是签名字段的名称,其签名标志着该修订版。)
但我怎样才能检索所有修订版(或至少他们的名字)?到目前为止,我还没有在iText API和网络中找到任何内容。
如前所述,那些修订名称实际上是签名字段名称。因此,您可以使用
String
检索可以提取修订版的所有名称。