删除多个PDF文件的密码

时间:2008-10-24 10:14:01

标签: pdf text encryption

所以我有大量的PDF文件,我需要从中提取文本。 文件已加密,但我知道它们的密码。我正在寻找一种自动化提取文本的方法。

我可以在Acrobat professional中手动打开文件,通过输入密码来删除安全性,然后另存为.txt文件。但是对于600个文件的批量处理,没有办法实现自动化。

我正在寻找一些工具来帮助解决这个问题。我很擅长Perl,所以我尝试了CPAN的各种PDF处理模块,但他们没有读取加密文档。任何人都有这方面的解决方案吗?

7 个答案:

答案 0 :(得分:4)

看看pdftk。它是基于控制台的,可处理密码保护的PDF文件。

答案 1 :(得分:3)

pdftotext应该能够做到这一点。它附带了poppler库,也可以找到xpdf(poppler来自xpdf)。

答案 2 :(得分:1)

尝试pdftk

pdftk secured.pdf input_pw foopass output unsecured.pdf

答案 3 :(得分:1)

您可以尝试使用PDF Password Cracking实用程序

中的特殊功能

它被称为“解密”选项 - 您可以填写密码aт,制作一份不受保护的PDF文件副本

答案 4 :(得分:0)

我同意Desstan,AutoIt或AutoHotkey可用于使用GUI自动执行任何无法通过其他方式自动执行的任务。虽然它可能很慢并可能在意外情况下停止(加上有一个学习曲线,但至少AutoHotkey论坛非常有用,尽管需要让Acrobat Professional为它编写脚本......)。

事实上,Xpdf似乎是一个有趣的工具,包括文本提取器和支持decryption

答案 5 :(得分:0)

CAM::PDF是一个开源Perl库,可以加密和解密PDF。目前它只能进行40位加密,其中所有者和用户密码相同,但就在今天(巧合),用户提交了一个允许128位加密和解密的补丁。我希望下周发布一个新版本的增强版。

CAM :: PDF在提取文本方面不是很擅长。

答案 6 :(得分:-1)

如果你找不到任何体面的纯编程方式,可以选择AutoIt

它是“一种免费的类似BASIC的脚本语言,专为自动化Windows GUI而设计”,可以在你喝杯咖啡的同时为你指点点击。