我很好奇PDF如何保障工作?我可以锁定PDF文件,这样系统就无法识别文本并使用PDF文件进行操作。我发现的一切都是关于"如何锁定/解锁"但是没有关于"它是如何工作的"。有没有人可以向我解释一下? THX
答案 0 :(得分:1)
OP在评论中澄清
我的意思是用PDF文件锁定文本识别或操作。密码学不应该只是一些技巧。
有一些选择,其中包括:
您可以将文本呈现为位图,并在PDF中包含该位图
- >没有文字信息。
或者您可以使用非标准编码嵌入有问题的字体而不使用标准字形名称
- >未知编码中的文本信息。
E.g。比照在this answer中分析了PDF。
一个特殊情况:只对一些字符进行编码错误,可能只有一个,可能是一个数字。这样一个unalert人认为一切都被提取出来,并且只有在使用数据时,错误才会开始搞砸事情,特别是在数字错误的情况下很难解决。例如。比照PDF格式分析在this answer。
或者您可以将文本放在文本提取软件或复制和粘贴例程通常看不到的结构中,例如创建包含某些文本区域的文本的大图案图块并使用匹配的图案颜色填充该区域
- >文本信息存在但大多数提取器都看不到。
E.g。比照this answer;这里的技术用于使水印文本不可提取。
或者您可以在整个页面上添加额外的文字,但要使其不可见,例如在图像下,在渲染模式3(不可见)中绘制,位于一些禁用的可选内容组(图层)中,...文本提取器通常不检查它们实际提取的文本是否可见。
- >文本信息存在但被垃圾文本位污染。
...