无法遍历列表-pyPDF2

时间:2018-08-10 04:07:20

标签: python python-3.x list pypdf pypdf2

运行以下代码会在第pdfReader行抛出错误

pdf=['/somepath/a.pdf','/somepath/b.pdf']

for count in range(len(pdf)):
    name=pdf[count]
    pdfFileObj = open(name, 'rb')
    pdfReader = PyPDF2.PdfFileReader(pdfFileObj) #Error at this line
    pages=pdfReader.numPages

错误-PdfReadWarning:外部参照表未为零索引。对象的ID号将被更正。 [pdf.py:1736]

但是,当我只是像这样通过下面的pdf位置时,但是我需要一个循环才能使用每个pdf。

pdfFileObj = open(pdf[0], 'rb')

即使我尝试过,但它再次失败PdfReader

for p in pdf:
    pdfFileObj = open(p, 'rb')

1 个答案:

答案 0 :(得分:2)

根据this site,此错误表示外部参照表的第一部分不是以对象零开始。您可以通过传递选项strict = false来解决此问题,PyPDF2将自动更正对象ID号。通常这不是一个大问题,Adobe仍会读取您的PDF。干杯。