我有一个带书签的pdf文件,我需要获取此书签列表。 现在基于此answer,我使用Python 3.7.2和PyPDF2 1.26.0编写此代码:
import os
from PyPDF2 import PdfFileReader
from PyPDF2.pdf import Destination
from os.path import isfile, join
folder = "doc"
print("All files")
print(os.listdir(folder))
pdf_files = [f for f in os.listdir(folder) if isfile(join(folder, f))]
print("First file")
print(pdf_files[0])
pdf_file = folder + "/" + pdf_files[0]
# Read the pdf file
reader = PdfFileReader(open(pdf_file, 'rb'))
print(reader.getOutlines()) #return [] this is wrong
print(reader.getNumPages()) #return correct number pages
print(reader.getDocumentInfo()) #return correct information
如您所见,getNumPages和getDocumentInfo可以正常工作,但是我无法访问我的书签。 PyPDF2 doc不多说。我不知道我哪里错了。