使用slate时unicodeDecodeError

时间:2019-01-23 18:03:48

标签: python centos slate

我需要一些pdf来提取信息。我在centos 7上使用python的lib slate使用python。 一开始,板岩效果很好。但是然后我必须更新几个模块和库。 slate lib不再起作用。 为了解决该问题,我尝试更新slate,并尝试使用不同的版本,但是它们都不起作用。 错误是:

File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`

当我取消代码后,一切正常。

我正在使用slate的一段代码:

def adequacaoCut(pdf, person, pathInt, pathImg):
    with open('pdfs/'+pdf, 'rb') as f:
        doc = slate.PDF(f)
        print doc
        ... rest of code that works fine
  • 板岩版本:0.5.2

  • python版本:2.7

随着时间的流逝,我不再想起那些在python,centos或我所做的事情上的库或更新了。 我该怎么办?

1 个答案:

答案 0 :(得分:0)

我自己解决问题。我发现我的计算机上有两个pdfminer(pdfminer和pdfminer.six)。我认为这些库之间存在某种冲突,或者slate试图调用pdfminer.six而不是pdfminer。 我同时卸载了两者,仅重新安装了pdfminer。现在它就像一种魅力。