我需要在Python中提取pdf注释。我所有的搜索都表明我需要Poppler这样做,例如运行this
但是我在安装Poppler时遇到了很多麻烦。我在OS X(Yosemite)上使用Python 3.4。这是我到目前为止所尝试的内容:
1. pip
pip3 install python-poppler-qt4
给出了
ImportError: No module named 'sipdistutils'
2。接下来我试了
pip3 install pypoppler
得到了
NameError: name 'file' is not defined
3。接下来我尝试从here下载 与1.相同的错误。我搜索了sipdistutils并找到了我认为可能是它的this。我将它复制到文件夹并再次尝试pip。这次我得到了
File "/python-poppler-qt4-0.24.0/sipdistutils.py", line 32
raise RuntimeError, "cannot parse SIP-generated '%s'" % sbf
4。接下来,我尝试从here下载并使用./configure构建,其中包含:
checking for PYPOPPLER... configure: error: Package requirements ( pygtk-2.0 >= 2.10.0,
atk >= 1.6.0,
poppler-glib >= 0.12
) were not met:
No package 'pygtk-2.0' found
No package 'atk' found
No package 'poppler-glib' found
Consider adjusting the PKG_CONFIG_PATH environment variable if you
installed software in a non-standard prefix.
5。 MacPorts的
sudo port install py34-poppler-qt4
Error: Failed to install poppler
Please see the log file for port poppler for details:
/opt/local/var/macports/logs/_opt_local_var_macports_sources_rsync.macports.org_release_tarballs_ports_graphics_poppler/poppler/main.log
错误:未安装以下依赖项:poppler-qt4-mac poppler qt4-mac dbus libmng lcms py34-pyqt4 dbus-python34 dbus-glib python34 python3_select py34-sip
我觉得我对其中的几种方法非常接近 - 而且非常小的东西会解决这个问题。
答案 0 :(得分:2)
安装Homebrew并在终端粘贴poppler的receipe为我工作。 OS-x sierra
答案 1 :(得分:0)
以下内容仍然有效(2019年10月)
brew install poppler
答案 2 :(得分:0)
使用 conda:
conda install poppler
根据我的经验,conda
是安装具有外部(非 Python)依赖项的 Python 包的最佳解决方案。有两种安装 conda 的选项,要么是完整的 Anaconda 发行版,要么是极简的 Miniconda 实用程序。我更喜欢 Miniconda,它可以通过运行 Bash 脚本来安装,可以在这里找到:
安装 Miniconda 后,您通常create a new environment 然后激活它,例如:
conda create --name py37 python=3.7
conda activate py37
然后您可以使用 conda
在活动的 Conda 环境中安装软件包,例如安装poppler
:
conda install poppler
您也可以使用 pip
安装软件包,例如安装 pdftotext
- 依赖于 poppler
的软件包:
pip install pdftotext
答案 3 :(得分:0)
在 pycharm/setting/interpreter/available 包中安装对我有用(2021-08),所以也许在 Anaconda 包管理中安装也有效,但我没有尝试后一个。