我正在使用Python将一个文件夹下的许多PDF合并为一个PDF。但是我知道其中一个PDF具有密码,所以我需要解密它,密码是:rosebud。
当我遍历此文件夹中的所有PDF文件时,我的代码确实解密了该文件,但是我不断收到错误消息:PyPDF2.utils.PdfReadError:文件尚未解密。
我的代码:
import PyPDF2, os
pdfFiles=[]
pdfFiles = [filename for filename in os.listdir('.') if filename.endswith('.pdf')]
pdfFiles.sort(key=str.lower)
pdfwriter=PyPDF2.PdfFileWriter()
#loop through all the PDF file
for filename in pdfFiles:
pdfReader=PyPDF2.PdfFileReader(open(filename,'rb'))
if pdfReader.isEncrypted:
pdfReader.decrypt('rosebud')
#all page except first:0
for pagenum in range(1,pdfReader.numPages):
pageObj=pdfReader.getPage(pagenum)
pdfwriter.addPage(pageObj)
pdfoutput=open('allmyfile.pdf','wb')
pdfwriter.write(pdfoutput)
pdfoutput.close()
谢谢
答案 0 :(得分:2)
您的代码很可能不会真正解密文件。
如果解密失败,decrypt
方法不会引发异常;它返回0
。由于您忽略了该返回值,因此无法知道它是否成功。
如果解密失败,则稍后尝试读取文件时,您会得到PyPDF2.utils.PdfReadError: File has not been decrypted
。
您应该更改代码以执行以下操作:
if pdfReader.isEncrypted:
decrypt = pdfReader.decrypt('rosebud')
if decrypt == 0:
# print a warning and skip the file? raise an exception?
当然要真正解决该问题,您需要使用正确的密码来解密PDF。