使用Python将PDF文件读作文本

时间:2017-03-23 09:43:54

标签: python pdf

错误

  

追踪(最近一次通话):     文件" C:/Users/XXX/pdf_to_text.py",第7行,在模块中       导入石板

     

文件" C:\ Python27 \ lib \ site-packages \ slate__init __。py",第48行,in       从平板导入PDF   文件" C:\ Python27 \ lib \ site-packages \ slate \ slate.py",第3行,在模块中

     

来自pdfminer.pdfparser导入PDFParser,PDFDocument

     

ImportError:无法导入名称PDFDocument

代码:

import slate
with open('C:\Users\XXX\XXX.pdf', 'rb') as f:
pdf_text = slate.PDF(f)
print pdf_text

有人可以就如何解决此错误提出建议吗?

我想使用.PDF阅读Python文件内容。

1 个答案:

答案 0 :(得分:1)

您需要安装正确的pdfminer版本。看起来像你没有定义的那个PDFDocument这就是你得到ImportError的原因。检查slate中的依赖项并获取正确的版本。

您可以通过

检查现有版本
pip list