我想使用PDFMiner 3k,我在Windows上使用python 3.3.3,我不知道要编写什么指令来使用PFDMiner 3k,我已经尝试了很多代码并且仍然不起作用,其中一些是PDFMiner(python 2.7),例如我尝试了下一个代码:
import nltk
from io import StringIO
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage
请注意,我已将脚本文件放在包含PDFMiner 3k目录的目录中。后者名为pdfminer。
我收到了下一个错误:
ImportError: No module named 'pdfminer.pdfminer'; pdfminer is not a package
有什么建议吗?我需要帮助。
答案 0 :(得分:1)
很难说,但听起来您的问题是您没有安装PDFMiner3k,只是将其解压缩到与您的数据相同的目录中。
不要这样做。一些包以这种方式工作,但大多数都没有。另外,PDFMiner3k
需要一些不会附带Python的软件包,例如ply
。如果你没有它们,它将无法正常工作。
安装包的正确方法几乎总是使用pip
。
事实上,你甚至不必下载它;只需pip install PDFMiner3k
,pip
将搜索最新版本及其所需的所有内容的最新版本,并为您安装所有版本。
当然,如果您希望nltk
正常工作,您还需要安装NLTK。但你可能会猜到这个命令。
有些软件包需要构建C编译器。虽然大部分都应该使用二进制轮,因此pip install spam
仍然有效,但有些软件包并不是最新的。因此,如果您遇到有关编译器或vcvarsall或类似的错误,请查看Christoph Gohlke's site;他的轮子包装不能自己制作。