用于PDF验证的iText API详细信息

时间:2012-12-26 09:32:43

标签: itext

我将参与案例研究,我要求使用某些标准验证PDF(例如,检查PDF中的内容是否具有特定字体,字体大小,徽标位置)。所以我只想确认使用iTEXT我是否可以获得这些PDF规范?如果是,iTEXT中使用的API是什么?

注意:市场上是否有其他工具可以实现这种功能?

1 个答案:

答案 0 :(得分:2)

由于iText允许您直接访问所有PDF对象(字典,数组,流......),它为您提供所需的工具。但是不要低估你的任务。根据您必须检查的标准,您可能需要做很多工作。

E.g。如果您的标准包括所有文本都必须使用单个给定字体,您可以简单地解析整个文档文本并检查字体。另一方面,如果你必须区分,例如标题和标准文本,您需要引入一些启发式方法,因为通常标题不会标记为标题。

您的支票有多好?如果字体字典具有所需的名称条目或者您是否确实需要检查字体(可能是嵌入字体子集)是否是所需字体,这是否足够?

您提到徽标位置。你如何识别徽标(与其他图纸或图像相比)?

...

因此,iText可以作为基础,但你必须事先做很多思考。如果您决定认真使用iText,我建议您咨询iText in Action — 2nd Edition

还有其他PDF库和工具可用,既免费(免费啤酒或免费游戏)和商业,它们提供PDF分析框架。我主要使用iText,因此,不深入了解其他那些。

Ceterum censeo,您应该明确地查看PDF规范ISO 32000-1:2008(特别是关于图形和文本的第8章和第9章),以了解PDF包含的内容和不包含的内容。