使用PyPDF2通过python加密许多PDF

时间:2019-03-21 14:13:15

标签: python pdf encryption permissions pypdf2

我正在尝试制作一个python程序,该程序循环遍历文件夹中的所有文件,选择扩展名为'.pdf'的文件,并使用受限权限对其进行加密。我正在使用此版本的PyPDF2库: https://github.com/vchatterji/PyPDF2。 (对原始PyPDF2的修改,也允许设置权限)。我已经用一个pdf文件对其进行了测试,并且效果很好。我希望删除原始的pdf文件,并且加密的文件应保持相同的名称。 这是我的代码:

import os
import PyPDF2

directory = './'

for filename in os.listdir(directory):
    if filename.endswith(".pdf"): 
        pdfFile = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFile)
        pdfWriter = PyPDF2.PdfFileWriter()
        for pageNum in range(pdfReader.numPages):
            pdfWriter.addPage(pdfReader.getPage(pageNum))
        pdfFile.close()
        os.remove(filename)
        pdfWriter.encrypt('', 'ispat', perm_mask=-3904)
        resultPdf = open(filename, 'wb')
        pdfWriter.write(resultPdf)
        resultPdf.close()
        continue
    else:
        continue

它出现以下错误:

  C:\Users\manul\Desktop\ghh>python encrypter.py
  Traceback (most recent call last):
  File "encrypter.py", line 9, in <module>
  pdfReader = PyPDF2.PdfFileReader(pdfFile)
  File "C:\Users\manul\AppData\Local\Programs\Python\Python37\lib\site-packages\PyPDF2\pdf.py", line 1153, in __init__
  self.read(stream)
  File "C:\Users\manul\AppData\Local\Programs\Python\Python37\lib\site-packages\PyPDF2\pdf.py", line 1758, in read
    stream.seek(-1, 2)
  OSError: [Errno 22] Invalid argument

我有一些PDF存储在桌面的'ghh'文件夹中。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

使用pdfReader = PyPDF2.PdfFileReader(filename)将使阅读器正常工作,但是此特定错误是由文件为空引起的。您可以使用os.path.getsize(filename)检查文件大小。您的文件可能被擦除了,因为脚本删除了原始文件,然后使用open(filepath, "wb")创建了一个新文件,然后由于pdfWriter.write(resultPdf)发生错误而错误地终止,从而使原始文件为空文件文件名。

如上所述,将文件名而不是文件对象传递给PdfFileReader可解决pdfWriter发生的错误(我不知道为什么),但是您需要替换所有空文件在您的目录中,带有原始pdf副本以摆脱OSError。