如何以二进制格式打开pdf文件

时间:2017-01-19 14:23:28

标签: django python-2.7 django-rest-framework

我想阅读pdf文件的元数据,所以我使用的是pyPdf包但是对于某些文件我面临错误(即; PdfFileReader流/文件对象不是二进制模式,可能无法正确读取)

1 个答案:

答案 0 :(得分:1)

您需要以二进制模式读取文件:

from pyPdf import PdfFileReader
with open('document.pdf', 'rb') as f:
    pdf = PdfFileReader(f)