如何通过一些文本替换和编辑来复制PDF

时间:2016-09-02 10:37:51

标签: pdf c#-4.0 itext itext7

我正在探索几个第三方组件,以便通过C#使用PDF。这些是Aspose.pdf.net和iTextSharp。以下是我正在探索的内容的详细信息:

我有一些PDF文件包含文字形式的敏感信息,例如人名,城市等。 这些PDF需要复制到另一个副本中,但在创建重复副本时,需要搜索敏感文本。替换为一些虚拟文本。更换对于避免以任何欺诈手段追踪原始信息至关重要。 此外,替换的文本需要编辑。

预计查找文本将支持RegEx,因为可能存在需要屏蔽的文本变体。

你能帮我解决一下如何使用iTextShart。

提前致谢。

1 个答案:

答案 0 :(得分:1)

iTextSharp能够使用PdfSweep模块(http://itextpdf.com/itext7/pdfsweep)完成编辑(可视化以及存储在pdf中的数据)。 为了在文本搜索之后进行编校,您必须:

  1. 从文档中提取文本(可以使用iText完成)。
  2. 搜索提取的文本并获取要编辑的文本的位置。 (需要在你身边实施)
  3. 使用这些位置来定义PdfSweep必须编辑的位置。 (几行代码)
  4. 默认情况下,PdfSweep可视化通过在位置上绘制彩色条来进行编辑,并在内部删除文本和任何图像。 虽然技术上可以使用iText用一些虚拟文本填充编辑位置,但其实现存在许多缺陷。

    PdfSweep是iText7的封闭源模块,您可以联系我们的销售团队获取有关许可的更多信息。