我想使用pdfminer来提取文本信息。我已经下载了pdfminer-20131113。我在C:\python34
中安装了python。
现在使用cmd,我正在设置pdfminer的setup.py
文件的路径。
并运行以下命令。
python setup.py install
但我收到以下错误。
> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
File "setup.py", line 3, in <module>
from pdfminer import __version__
File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
if __name__ == '__main__': print __version__
^
SyntaxError: invalid syntax
pdfminer的setup.py文件中似乎有些错误,我不知道如何解决。
另外,我在pdfminer的build文件夹中看到了一个pdf2txt.py文件。我也尝试将其用作pdf2txt.py -o output.html pdffilename.pdf
(带完整路径)。而不是转换它。它会打开pdf2txt.py
文件。
答案 0 :(得分:6)
完全用Python编写。 (适用于2.4或更高版本)
并进一步向下:
安装Python 2.4或更高版本。 (不支持Python 3。)
因此您必须安装Python 2才能运行此项目。
或者,您可以尝试Python 3 port, pdfminer3k
;它没有在20个月内看到任何更新,而PDFMiner确实有更新的版本,所以你的里程可能会有所不同。
答案 1 :(得分:1)
这应该可以解决您在Python 3中的问题
pip install pdfminer.six
答案 2 :(得分:0)
pdfminer.six是使用6的Python 2 + 3支持的fork。上一次提交是15天前。