我通过了文件对象,但是仍然使用slate3k解析错误

时间:2019-04-05 12:01:03

标签: python python-3.x slate

我正在尝试使用“ slate3k”读取pdf文件的文本数据。对我来说似乎很好。但是我收到解析错误

我一直在使用“ python3.7”。

import slate3k

with open("/home/am-it/Desktop/PythonLearning/pdf_practice/invoice-1.pdf","rb")as file:
    doc = slate3k.PDF(file)
    print(doc)

以上代码的输出应为pdf格式的文本。但实际输出是

 "Traceback (most recent call last):
  File "/home/am-it/Desktop/PythonLearning/pdf_practice/invoslate.py", line 4, in <module>
    doc = slate3k.PDF(file)
  File "/home/administrator/.local/lib/python3.7/site-packages/slate3k/classes.py", line 59, in __init__
    self.doc = PDFDocument()
TypeError: __init__() missing 1 required positional argument: 'parser'" 

我已经传递了正确的文件对象,但是仍然出现错误。所以请赐教我

2 个答案:

答案 0 :(得分:0)

我的单引号有效且打印不缩进

import slate3k as slt
with open('pdfPythonTest.pdf','rb') as f:
    extracted_text=slt.PDF(f)
print(extracted_text)

希望这会有所帮助!

答案 1 :(得分:-1)

Dude, 在这部分代码中: 并以open(“ / home / am-it / Desktop / PythonLearning / pdf_practice / invoice-1.pdf”,“ rb”)作为文件:

您必须输入文件名加上扩展名而不是路径。 因此,请尝试以下操作: 使用open(“ invoice-1.pdf”,“ rb”)作为文件: