有什么方法可以创建PDF,以便无法复制/提取文本?

时间:2009-11-16 17:30:53

标签: pdf pdf-generation

我正在尝试帮助创建一个邻居目录,我想阻止某人从中收集联系信息(尤其是电子邮件地址)。

有没有简单的方法可以阻止某人从PDF中复制和粘贴该文本?

更新 这里的目标是使PDF不容易从当前纸质目录中获取电子邮件地址,并使PDF目录与纸张目录一样有用。在线pdf目录将具有诸如始终保持最新并节省一些打印成本(或将这些成本转嫁给想要打印文档的人)的优点。

5 个答案:

答案 0 :(得分:4)

如果数据是可读的,我认为这是你的目标,那么你无法阻止一个专门的人接受并使用它。转换为图像将使其变得困难,但任何拥有良好OCR或廉价外国劳工团队的人都可以从中获得任何他们想要的东西。如果数据非常敏感并且你担心它,你应该重新考虑发布它的价值。

答案 1 :(得分:3)

使用图像而不是文本会使自动从PDF中抓取数据变得更加困难。

我之前的一项工作包括将PDF中的数据重新格式化为(特定的)更结构化的文档格式,当我们获得文本为图像的PDF时 - 更不用说模糊或难以阅读的图像 - OCR将是充斥着错误的字母,我们必须手工进去并解决大部分问题。

答案 2 :(得分:2)

其他答案是个好的开始。但是,我确切地知道如何锁定PDF以防止复制。

您可以使用Primo PDF的免费pdf驱动程序并更改安全设置: http://www.primopdf.com/help/tip_secure_pdf.aspx

要为您的PDF添加密码安全性,请继续阅读以了解如何使用PrimoPDF免费使用。

  1. 下载并安装免费的PDF驱动程序: http://www.primopdf.com/download.aspx
  2. 打开文件以转换为PDF
  3. 打开“打印”对话框(或按Ctrl + P)
  4. 在打印机列表中,选择PrimoPDF
  5. 点击打印
  6. 在PrimoPDF对话框中,单击安全标签旁边的更改按钮以打开安全对话框。
  7. 两次输入您的开放密码。
  8. (可选)输入权限密码,然后选择要限制的功能。
  9. 单击“确定”。
  10. 单击“创建PDF”。
  11. 最后提示。如果要对所创建的所有PDF文件应用安全性,可以通过正确配置PrimoPDF轻松完成。在对话框的底部(见上文),只需确保打开“始终使用这些设置”选项。

答案 3 :(得分:0)

PDF允许锁定文档(源文本将被加密,但可读),因此属性将不允许读者从中打印或复制。

无论如何,我会劝阻这种用法,因为使用这种PDF是痛苦的。就个人而言,我建议你寻找其他方法,而不是积极地让你的文档读者生气。

PS:从PDF收集电子邮件几乎闻所未闻。

答案 4 :(得分:0)

另一种可能的解决方案如下:

  1. 将文本转换为向量(某些开源工具可以执行此操作),因此与在pdf中包含图像相比,PDF文件仍将保持较小的尺寸。
  2. 破解PDF以破坏内部字体索引到unicode符号映射,这样复制的文本将被复制为垃圾(因为pdf阅读器应用程序将无法找到从图像到其字符值的正确映射)。
  3. 免责声明:我为ByteScout工作,这是PDF Extractor SDK工具的供应商,可用于从像这样的PDF文件中恢复所有可能损坏的文本,所以如果有人真的想要从pdf恢复文本然后它可以完成(尽管有更少或更多的错误)。