我需要一些pdf来提取信息。我在centos 7上使用python的lib slate使用python。 一开始,板岩效果很好。但是然后我必须更新几个模块和库。 slate lib不再起作用。 为了解决该问题,我尝试更新slate,并尝试使用不同的版本,但是它们都不起作用。 错误是:
File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`
当我取消代码后,一切正常。
我正在使用slate的一段代码:
def adequacaoCut(pdf, person, pathInt, pathImg):
with open('pdfs/'+pdf, 'rb') as f:
doc = slate.PDF(f)
print doc
... rest of code that works fine
板岩版本:0.5.2
python版本:2.7
随着时间的流逝,我不再想起那些在python,centos或我所做的事情上的库或更新了。 我该怎么办?
答案 0 :(得分:0)
我自己解决问题。我发现我的计算机上有两个pdfminer(pdfminer和pdfminer.six)。我认为这些库之间存在某种冲突,或者slate试图调用pdfminer.six而不是pdfminer。 我同时卸载了两者,仅重新安装了pdfminer。现在它就像一种魅力。