为什么说“'PDF文档'没有在pdfminer中定义”?

时间:2017-04-22 23:23:10

标签: python pdf pdfminer

我是Python的初学者。我上周末开始了。我使用的是Python 3。

我正在尝试从pdf文件中读取文本。我首先按照Automate Boring Stuff中的说明尝试了pyPDF2,但是我得到的结果在单词之间没有空格,因此无法使用。然后我在命令行中输入“pip install pdfminer3k”来安装pdfminer3k。

然后我在解释器中输入以下行:

import pdfminer, os
base_path = ("C://Users//ross_")
my_file = os.path.join(base_path + "/" + "sample2.pdf")
log_file = os.path.join(base_path + "/" + "pdf_log.txt")
password = ""
extracted_text = ""
fp = open(my_file, "rb")
parser = PDFParser(fp)
document = PDFDocument(parser, password)

但最后一行给了我这个错误信息:

追踪(最近一次通话):   文件“”,第1行,in     document = PDFDocument(解析器,密码) NameError:名称'PDFDocument'未定义

有谁知道我为什么会收到该错误消息?我认为PDF文档将在pdfminer模块中定义。更一般地说,怎么弄清楚这样的东西?是不是有资源解释如何使用像pdfminer这样的模块?非常感谢和道歉,因为我完全无知。

0 个答案:

没有答案