问题: 我一直在尝试使用 Python 库 pdf2image,我知道它需要事先安装 poppler。 Poppler 已安装(通过自制软件)并通过 pip 安装包。
但是,当运行 convert_to_path(my_pdf)
时,我得到以下信息:
Traceback (most recent call last):
File "<ipython-input-9-ba107659b495>", line 1, in <module>
test_image = convert_from_path(testfile,
File "/Users/<myuser>/.pyenv/versions/3.8.0/lib/python3.8/site-packages/pdf2image/pdf2image.py", line 97, in convert_from_path
page_count = pdfinfo_from_path(pdf_path, userpw, poppler_path=poppler_path)["Pages"]
File "/Users/<myuser>/.pyenv/versions/3.8.0/lib/python3.8/site-packages/pdf2image/pdf2image.py", line 467, in pdfinfo_from_path
raise PDFInfoNotInstalledError(
PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?
我的系统: Mac,OC 10.15.7 Python(通过 Homebrew)版本 3.8.0
which python
/Users/<myuser>/.pyenv/shims/python
which pip
/Users/<myuser>/.pyenv/shims/pip
到目前为止我尝试过的:
Poppler 通过自制软件 (brew install poppler
) 安装,pdf2image 通过 pip3 install pdf2image
安装
我也跑过 brew cleanup
。
尝试使用以下内容在 convert_to_path 中强制 poppler 路径,
pop_path = "/usr/local/Cellar/poppler/21.03.0_1"
convert_to_path(my_pdf_file,poppler_path = pop_path)
但仍然出现相同的错误。
在网上好好看看,发现很多人有类似但不完全相同的问题。我觉得我一定是做错了什么,所以任何指导都会很棒。
答案 0 :(得分:0)
部分解决方案?
在手动输入pop_path文件路径时,忘记在路径后面追加/bin了,
pop_path = "/usr/local/Cellar/poppler/21.03.0_1/bin"
代码现在可以使用了。虽然我的自尊需要一些时间才能恢复...
我觉得我可能仍然遇到了错误的配置问题?关于类似问题的许多帖子似乎暗示安装了自制软件的popper 不应该有这个问题。可能是因为我也在使用 pyenv?