无法在Python 3.6上安装pdftotext,缺少poppler

时间:2017-08-28 06:08:42

标签: python install pdftotext

如何正确安装pdftotext?

在Python 3.6中安装pdftotext时,我收到以下错误消息。我还尝试通过下载zip文件手动安装软件包,但仍然遇到同样的错误。

  pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory
  error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\cl.exe' failed with exit status 2     

6 个答案:

答案 0 :(得分:12)

我在pdftotext包中的Readme.md文件中找到了一些帮助:

1)安装操作系统依赖项:

关于Debian,Ubuntu和朋友们:

sudo apt-get update
sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev

在Fedora,Red Hat和朋友们身上:

sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config

2)正常安装:

pip install pdftotext

它对我有用。

答案 1 :(得分:6)

几天来,我一直在试图找出如何在Win10上安装pdftotext的方法。互联网搜索没有给我任何帮助。因此,对于那些需要知道的人来说,这里是在Ananada的Win10上安装pdftotext的方法。 YMMV。

安装Anaconda Python。关于安装Anaconda的文章很多,因此在这里我将不再探讨。

尝试运行pip install pdftotext,您将收到一条错误消息,要求使用Microsoft Visual C ++。

在浏览器中导航到http://visualstudio.microsoft.com/downloads。在“ Visual Studio 2019工具”选项卡下,下载“ Visual Studio 2019构建工具”。然后,您将通过选中“ C ++构建工具”选项框并单击“安装”来安装工具。

您现在应该获得pip安装,以克服VC ++错误。不幸的是,您现在会收到错误“无法打开包含文件:'poppler / cpp / poppler-document.h'。这是因为您缺少poppler库。

回到互联网!您需要Windows的poppler。在撰写本文时,最好的选择是http://blog.alivate.com.au/poppler-windows。获取最新的二进制文件,然后解压缩。如果您发现错误,则pip在{Anaconda3目录} \ include \ poppler \ cpp \ poppler-document.h中查找头文件。因此,请查看刚刚解压缩的档案。在include文件夹中,您会看到一个poppler目录。如果您进入其中的cpp目录,则会找到poppler-document.h文件。

我将整个poppler目录复制到Anaconda3 \ include文件夹中,这样做。

如果您尝试再次运行pip install,仍然会出现大量错误!但是这些都不是您之前看到的任何错误,而是该错误正在寻找缺少的链接库poppler-cpp.lib。通过Conda进行的搜索将其安装在另一台计算机上,该文件位于poppler软件包中。所以

conda install -c conda-forge poppler

将安装我们的poppler-cpp.lib文件。然后,我们可以从其主目录{Anaconda3目录} \ Library \ lib \ poppler-cpp.lib复制该文件,并将其粘贴到pdftotext期望的{Anaconda3目录} \ libs处。

如果我们再次执行pip安装pdftotext,就可以了!我敢肯定有人会找到一种方法来对此进行改进,但目前我们在Win10上有一个可用的pdftotext Python库。

这些说明和截图可以在我的博客https://coder.haus/2019/09/27/installing-pdftotext-through-pip-on-windows-10/

中找到

答案 2 :(得分:4)

下面的命令解决了我的问题。

sudo apt-get install libpoppler-cpp-dev

https://blog.droidzone.in/2018/05/01/install-pdftotext-python-extension-error/

答案 3 :(得分:0)

对于Mac OS: brew install poppler

答案 4 :(得分:0)

对于Ubuntu用户

sudo apt-get install libpoppler58=0.41.0-0ubuntu1 libpoppler-dev libpoppler-cpp-dev

为我工作

答案 5 :(得分:0)

用于Windows的简单解决方案:

  1. http://blog.alivate.com.au/wp-content/uploads/2018/10/poppler-0.68.0_x86.7z下载poppler zip文件
  2. https://visualstudio.microsoft.com/thank-you-downloading-visual-studio/?sku=BuildTools&rel=15下载并安装Visual Studio工具
  3. 将文件夹\poppler-0.68.0\bin设置为环境变量中的路径。

就这样。重新启动环境,例如可以是jupyter笔记本,vscode等。尽情享受