PyPDF2模块和加密的PDF文件

时间:2019-10-21 14:07:25

标签: pypdf2

我目前正在使用PyPDF2在Python中处理PDF文件。

当我运行脚本以加载一些PDF文件并从PDF中提取一些关键字时,我无法:

PdfReadError: File has not been decrypted

为了(尝试并)解决这个问题,我实现了:

if pathObj.isEncrypted:
        pathObj.decrypt('')

但是,我却遇到了:

NotImplementedError: only algorithm code 1 and 2 are supported

现在,我有点理解错误告诉了我什么。我不了解的是我的所有PDF都不加密

有人知道为什么未加密的文件显然被加密吗? PyPDF2是否有此问题?

欢呼

1 个答案:

答案 0 :(得分:0)

这些PDF似乎是128位AES类型加密的。但是,它们仍然可以在Adobe中使用,只是不能与PyPDF2一起使用。

要解决此问题,您必须安装:

qpdf

并添加到代码中:

qpdf, --password=" ", --decrypt, in_put.pdf, out_put.pdf