我正在尝试帮助创建一个邻居目录,我想阻止某人从中收集联系信息(尤其是电子邮件地址)。
有没有简单的方法可以阻止某人从PDF中复制和粘贴该文本?
更新 这里的目标是使PDF不容易从当前纸质目录中获取电子邮件地址,并使PDF目录与纸张目录一样有用。在线pdf目录将具有诸如始终保持最新并节省一些打印成本(或将这些成本转嫁给想要打印文档的人)的优点。
答案 0 :(得分:4)
如果数据是可读的,我认为这是你的目标,那么你无法阻止一个专门的人接受并使用它。转换为图像将使其变得困难,但任何拥有良好OCR或廉价外国劳工团队的人都可以从中获得任何他们想要的东西。如果数据非常敏感并且你担心它,你应该重新考虑发布它的价值。
答案 1 :(得分:3)
使用图像而不是文本会使自动从PDF中抓取数据变得更加困难。
我之前的一项工作包括将PDF中的数据重新格式化为(特定的)更结构化的文档格式,当我们获得文本为图像的PDF时 - 更不用说模糊或难以阅读的图像 - OCR将是充斥着错误的字母,我们必须手工进去并解决大部分问题。
答案 2 :(得分:2)
其他答案是个好的开始。但是,我确切地知道如何锁定PDF以防止复制。
您可以使用Primo PDF的免费pdf驱动程序并更改安全设置: http://www.primopdf.com/help/tip_secure_pdf.aspx
要为您的PDF添加密码安全性,请继续阅读以了解如何使用PrimoPDF免费使用。
最后提示。如果要对所创建的所有PDF文件应用安全性,可以通过正确配置PrimoPDF轻松完成。在对话框的底部(见上文),只需确保打开“始终使用这些设置”选项。
答案 3 :(得分:0)
PDF允许锁定文档(源文本将被加密,但可读),因此属性将不允许读者从中打印或复制。
无论如何,我会劝阻这种用法,因为使用这种PDF是痛苦的。就个人而言,我建议你寻找其他方法,而不是积极地让你的文档读者生气。
PS:从PDF收集电子邮件几乎闻所未闻。
答案 4 :(得分:0)
另一种可能的解决方案如下:
免责声明:我为ByteScout工作,这是PDF Extractor SDK工具的供应商,可用于从像这样的PDF文件中恢复所有可能损坏的文本,所以如果有人真的想要从pdf恢复文本然后它可以完成(尽管有更少或更多的错误)。