解密许多PDF中的一个以在Python中合并为一个

时间:2018-06-20 01:21:12

标签: python pypdf2

我正在使用Python将一个文件夹下的许多PDF合并为一个PDF。但是我知道其中一个PDF具有密码,所以我需要解密它,密码是:rosebud。

当我遍历此文件夹中的所有PDF文件时,我的代码确实解密了该文件,但是我不断收到错误消息:PyPDF2.utils.PdfReadError:文件尚未解密。

我的代码:

import PyPDF2, os

pdfFiles=[]
pdfFiles = [filename for filename in os.listdir('.') if filename.endswith('.pdf')]   
pdfFiles.sort(key=str.lower)
pdfwriter=PyPDF2.PdfFileWriter()


#loop through all the PDF file
for filename in pdfFiles:
    pdfReader=PyPDF2.PdfFileReader(open(filename,'rb'))
    if pdfReader.isEncrypted:
           pdfReader.decrypt('rosebud')

#all page except first:0
    for pagenum in range(1,pdfReader.numPages):
        pageObj=pdfReader.getPage(pagenum)
        pdfwriter.addPage(pageObj)

        pdfoutput=open('allmyfile.pdf','wb')
        pdfwriter.write(pdfoutput)
        pdfoutput.close()

谢谢

1 个答案:

答案 0 :(得分:2)

您的代码很可能不会真正解密文件。

如果解密失败,decrypt方法不会引发异常;它返回0。由于您忽略了该返回值,因此无法知道它是否成功。

如果解密失败,则稍后尝试读取文件时,您会得到PyPDF2.utils.PdfReadError: File has not been decrypted

您应该更改代码以执行以下操作:

if pdfReader.isEncrypted:
    decrypt = pdfReader.decrypt('rosebud')
    if decrypt == 0:
        # print a warning and skip the file? raise an exception?

当然要真正解决该问题,您需要使用正确的密码来解密PDF。