我正在探索几个第三方组件,以便通过C#使用PDF。这些是Aspose.pdf.net和iTextSharp。以下是我正在探索的内容的详细信息:
我有一些PDF文件包含文字形式的敏感信息,例如人名,城市等。 这些PDF需要复制到另一个副本中,但在创建重复副本时,需要搜索敏感文本。替换为一些虚拟文本。更换对于避免以任何欺诈手段追踪原始信息至关重要。 此外,替换的文本需要编辑。
预计查找文本将支持RegEx,因为可能存在需要屏蔽的文本变体。
你能帮我解决一下如何使用iTextShart。
提前致谢。
答案 0 :(得分:1)
iTextSharp能够使用PdfSweep模块(http://itextpdf.com/itext7/pdfsweep)完成编辑(可视化以及存储在pdf中的数据)。 为了在文本搜索之后进行编校,您必须:
默认情况下,PdfSweep可视化通过在位置上绘制彩色条来进行编辑,并在内部删除文本和任何图像。 虽然技术上可以使用iText用一些虚拟文本填充编辑位置,但其实现存在许多缺陷。
PdfSweep是iText7的封闭源模块,您可以联系我们的销售团队获取有关许可的更多信息。