用Python隐藏PDF文件中的信息

时间:2010-11-02 22:37:34

标签: python reportlab pypdf

在Python中,我有ReportLab生成的文件。现在,我需要从该PDF中提取一些页面并隐藏机密信息。

我可以创建一个带有黑色斑点的PDF文件,并使用pyPdf来合并页面,但是人们仍然可以在黑暗斑点下选择和复制粘贴信息。

有没有办法让这些地方完全保密?

每个例子,我需要隐藏页面上的地址,我该怎么做?

谢谢,

2 个答案:

答案 0 :(得分:1)

基本上,您必须删除PDF页面内容流中的相应文本绘图命令。生成两次页面要容易得多,一次是使用机密信息,一次是没有机密信息。

有可能(我不太了解ReportLab)以特别制作PDF的方式使机密信息更容易访问(例如作为单独的XObjects)进行删除。仍然你必须对PDF进行相当低级别的操作 - 我建议反对。

答案 1 :(得分:0)

(抱歉,当我发布问题时,我无法登录...)

不幸的是,文档无法随意重新生成(上下文相关),而且这些PDF文件(大约35个)是3000多页。

我正在考虑使用pdf2ps和pdf2ps,但质量很高。

pdf2ps -dLanguageLevel = 3 input.pdf - | ps2pdf14 - output.pdf

如果我改用“pdftops”,文字仍然可以选择。如果有一种方法可以让它像“pdf2ps”一样不可选,但质量更好,它也可以。