我应该使用什么作为代码来运行PDFMiner 3k?

时间:2015-04-20 09:26:05

标签: python hash nlp pypi pdfminer

我想使用PDFMiner 3k,我在Windows上使用python 3.3.3,我不知道要编写什么指令来使用PFDMiner 3k,我已经尝试了很多代码并且仍然不起作用,其中一些是PDFMiner(python 2.7),例如我尝试了下一个代码:

import nltk

from io import StringIO

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter

from pdfminer.converter import TextConverter

from pdfminer.layout import LAParams

from pdfminer.pdfpage import PDFPage

请注意,我已将脚本文件放在包含PDFMiner 3k目录的目录中。后者名为pdfminer。

我收到了下一个错误:

 ImportError: No module named 'pdfminer.pdfminer'; pdfminer is not a package

有什么建议吗?我需要帮助。

1 个答案:

答案 0 :(得分:1)

很难说,但听起来您的问题是您没有安装PDFMiner3k,只是将其解压缩到与您的数据相同的目录中。

不要这样做。一些包以这种方式工作,但大多数都没有。

另外,PDFMiner3k需要一些不会附带Python的软件包,例如ply。如果你没有它们,它将无法正常工作。

安装包的正确方法几乎总是使用pip

事实上,你甚至不必下载它;只需pip install PDFMiner3kpip将搜索最新版本及其所需的所有内容的最新版本,并为您安装所有版本。


当然,如果您希望nltk正常工作,您还需要安装NLTK。但你可能会猜到这个命令。

有些软件包需要构建C编译器。虽然大部分都应该使用二进制轮,因此pip install spam仍然有效,但有些软件包并不是最新的。因此,如果您遇到有关编译器或vcvarsall或类似的错误,请查看Christoph Gohlke's site;他的轮子包装不能自己制作。