有没有办法在不平整现有文本的情况下展平pdf注释?

时间:2016-02-10 04:05:04

标签: macos pdf ocr

我试图在osx(El Capitan)的预览中压缩我对.pdf文件的注释,以确保它们无法修改。我特别希望确保无法删除或取消隐藏,以显示下面的文本。理想情况下,我还想保留文本的计算机可读性。

目前,我通过导出到.tif,然后转换回.pdf然后使用Abbyy FineReader Express进行OCR来实现这一目标。这有点荒谬,但最终结果几乎正是我想要的:永久注释和可搜索/可复制文本。它失去了一些质量,但是......并且增长了。

我对CLI感到满意,并且我安装了MacPorts和pdftk。我希望pdftk" flatten"选项可以做到这一点,但事实并非如此。它似乎只是压扁了表格领域。还有什么可以做到的吗?我发誓有一种方法可以在Windows 2000的某些旧的内置映像程序中执行此操作。 (但我还没回到那个):-)

我想我会选择一个光栅化文件的命令,当且仅当它:

  1. 一步到位
  2. 保持文件小
  3. 将文件保存为pdf
  4. 保持文件几乎与以前一样可读和漂亮
  5. 谢谢!

1 个答案:

答案 0 :(得分:0)

PDF中Redaction的“最佳实践”是使用Acrobat的Redaction工具,或Acrobat的(长期行业领导者)Redax Acrobat插件(尽管那个不是为MacOS制作的,据我记得)。

当然,导出为图片然后在其上运行OCR确实有效,但您必须绝对确保您还从任何私有数据和元数据中清除文件。

请注意,使用“真实”编辑工具,您可以进行智能搜索,甚至包括正则表达式。

使用Redaction,与其他安全和安全相关的问题一样,由您自行决定对您的价值。