使用Python 3.7 Anaconda将PDF转换为CSV

时间:2019-03-13 14:20:07

标签: python anaconda

我正在尝试将pdf文件“ January2019”转换为csv文件。原始的pdf仅包含某些页面上的表,而我正尝试提取这些表。我正在关注http://stanford.edu/~mgorkove/cgi-bin/rpython_tutorials/Using_Python_to_Extract_Tables_From_PDFs.php上的教程,但是当我插入时:

导入PyPDF2

PDFfilename =“ January2019.pdf”

pfr = PyPDF2.PdfFileReader(open(2019年1月,“ rb”))

输出显示为ModuleNotFoundError:没有名为“ PyPDF2”的模块...

PS。我对Python和编码非常陌生。任何提示将不胜感激!

5 个答案:

答案 0 :(得分:1)

您已经安装了PyPDF2吗?如果没有,请在您的终端(或cmd或powershell)中运行

conda install -c conda-forge pypdf2

请参见docs on Anaconda Cloud

答案 1 :(得分:0)

首先使用pip安装PyPDF2模块。 在终端/提示符中运行以下命令:

pip install pypdf2

答案 2 :(得分:0)

此错误告诉您正确的信息。您尚未安装模块PyPDF2。 首先安装:

pip install pypdf2

答案 3 :(得分:0)

如果您无法成功安装PyPDF2,则另一个选项(“使用PDFTables将表数据写入CSV”)不需要您安装此软件包。您将只通过一个简单的API来调用PDFTables。

答案 4 :(得分:0)

该错误表明您尚未安装PYPDF2

请按照此过程进行安装。

如果您正在使用Anaconda:

  • 转到您的Anaconda提示符并输入此代码 conda config --add channels conda-forge按下“ Enter”键
  • 打开conda伪造通道后,输入以下代码 conda install pypdf2并按Enter键