使用.NET提取PDF文档中标记为编辑的文本

时间:2012-08-24 10:22:58

标签: c# pdf acrobat redaction

我正在处理PDF acrobat附加产品,其中一项要求是在给定的PDF文档中提取标记为编辑的文本。

假设您知道什么是“编辑”(如果您没有http://acrobatusers.com/tutorials/redacting-pdf-files-survey-tools,请阅读此内容),请建议我如何发现任何已被“标记”为编辑的文本的坐标PDF然后提取确切的文本。

如果您认为可以引导我找到正确的答案,请询问更多详情。 我尝试过使用iTextSharp和Aspose.PDF库,但没有取得多大成功。

1 个答案:

答案 0 :(得分:3)

使用Acrobat标记文本以进行编辑时,会创建编校注释。编校注释将/ Subtype键设置为/ Redact。编校区域由注释字典中的/ QuadPoints键定义。我不知道iTextSharp或Aspose是否支持编辑注释。使用iTextSharp,您可以使用COS API检索原始PDF对象并检查所需的对象。