Question

我正在尝试将pdf文件“ January2019”转换为csv文件。原始的pdf仅包含某些页面上的表，而我正尝试提取这些表。我正在关注http://stanford.edu/~mgorkove/cgi-bin/rpython_tutorials/Using_Python_to_Extract_Tables_From_PDFs.php上的教程，但是当我插入时：

导入PyPDF2

PDFfilename =“ January2019.pdf”

pfr = PyPDF2.PdfFileReader（open（2019年1月，“ rb”））

输出显示为ModuleNotFoundError：没有名为“ PyPDF2”的模块...

PS。我对Python和编码非常陌生。任何提示将不胜感激！

Answer 1

您已经安装了PyPDF2吗？如果没有，请在您的终端（或cmd或powershell）中运行

conda install -c conda-forge pypdf2

Answer 2

首先使用pip安装PyPDF2模块。在终端/提示符中运行以下命令：

pip install pypdf2

Answer 3

此错误告诉您正确的信息。您尚未安装模块PyPDF2。首先安装：

pip install pypdf2

Answer 4

如果您无法成功安装PyPDF2，则另一个选项（“使用PDFTables将表数据写入CSV”）不需要您安装此软件包。您将只通过一个简单的API来调用PDFTables。

Answer 5

该错误表明您尚未安装PYPDF2。

请按照此过程进行安装。

如果您正在使用Anaconda：