使用python安装pdfminer时出现语法错误

时间:2014-03-25 10:37:38

标签: python python-3.x

我想使用pdfminer来提取文本信息。我已经下载了pdfminer-20131113。我在C:\python34中安装了python。 现在使用cmd,我正在设置pdfminer的setup.py文件的路径。 并运行以下命令。

python setup.py install

但我收到以下错误。

> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
  File "setup.py", line 3, in <module>
    from pdfminer import __version__
  File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
    if __name__ == '__main__': print __version__
                                               ^
SyntaxError: invalid syntax

pdfminer的setup.py文件中似乎有些错误,我不知道如何解决。

另外,我在pdfminer的build文件夹中看到了一个pdf2txt.py文件。我也尝试将其用作pdf2txt.py -o output.html pdffilename.pdf(带完整路径)。而不是转换它。它会打开pdf2txt.py文件。

3 个答案:

答案 0 :(得分:6)

PDFMiner project homepage州:

  

完全用Python编写。 (适用于2.4或更高版本)

并进一步向下:

  

安装Python 2.4或更高版本。 (不支持Python 3。

因此您必须安装Python 2才能运行此项目。

或者,您可以尝试Python 3 port, pdfminer3k;它没有在20个月内看到任何更新,而PDFMiner确实有更新的版本,所以你的里程可能会有所不同。

答案 1 :(得分:1)

这应该可以解决您在Python 3中的问题

pip install pdfminer.six

答案 2 :(得分:0)

pdfminer.six是使用6的Python 2 + 3支持的fork。上一次提交是15天前。