我试图在PyPDF2文件中使用PdfFileReader函数,每当我尝试打开文件时,我都会收到一条错误消息,提示我正在尝试读取一个空文件,当我查看pdf信息时会说是5 MB,所以我认为它不为空
我使用此链接下载了pdf文件:https://ir.aboutamazon.com/static-files/35fa4e12-78bd-40bc-a700-59eea3dbd23b
以前,如果没有将txt文件保存到与py文件相同的文件夹中,我在打开txt文件时会遇到错误,但是我认为这不适用于这种情况。
我想知道文件如何为空,或者我在PyPDF2中使用pdf阅读器功能是否不正确。由于某种原因该文件无法打开。我还尝试下载并创建许多其他pdf。
import PyPDF2
#Pdf of Amazon's proxy report for 2019
pdf = 'Amazon.pdf'
file = PyPDF2.PdfFileReader(open(pdf, "rb"))
回溯(最近通话最近): 文件“ /Users/jason/Desktop/untitled-1.py”,第5行,在 档案= PyPDF2.PdfFileReader(open(pdf,“ rb”)) init 中的文件“ /Users/jason/miniconda3/lib/python3.6/site-packages/PyPDF2/pdf.py”,第1084行 self.read(流) 文件“ /Users/jason/miniconda3/lib/python3.6/site-packages/PyPDF2/pdf.py”,第1691行,已读取 引发utils.PdfReadError('无法读取空文件') PyPDF2.utils.PdfReadError:无法读取空文件