解码HBase中的HappyBase数据

时间:2015-10-30 10:00:56

标签: python encoding decoding happybase

在尝试解码HBase中的值时,我看到了一个错误,但很明显Python认为它不是UTF-8格式,而是将数据放入HBase的Java应用程序只用UTF-8编码它< / p>

  
    
      

a =&#39; \ x00 \ x00 \ x00 \ x00 \ x10j \ x00 \ x00 \ x07 \ xe8 \ x02Y&#39;       a.decode(&#34; UTF-8&#34)       Traceback(最近一次调用最后一次):         文件&#34;&#34;,第1行,in         文件&#34; /System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py" ;,第16行,解码           return codecs.utf_8_decode(input,errors,True)       UnicodeDecodeError:&#39; utf8&#39;编解码器不能解码位置9中的字节0xe8:无效的连续字节

    
  

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

该数据无效utf-8,所以如果您真的从数据库中检索到它,那么您应该检查它/谁放在那里。