应用错误收集

解码HBase中的HappyBase数据

时间：2015-10-30 10:00:56

标签： python encoding decoding happybase

在尝试解码HBase中的值时，我看到了一个错误，但很明显Python认为它不是UTF-8格式，而是将数据放入HBase的Java应用程序只用UTF-8编码它< / p>

a =＆＃39; \ x00 \ x00 \ x00 \ x00 \ x10j \ x00 \ x00 \ x07 \ xe8 \ x02Y＆＃39;       a.decode（＆＃34; UTF-8＆＃34）       Traceback（最近一次调用最后一次）：         文件＆＃34;＆＃34;，第1行，in         文件＆＃34; /System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py" ;,第16行，解码           return codecs.utf_8_decode（input，errors，True）       UnicodeDecodeError：＆＃39; utf8＆＃39;编解码器不能解码位置9中的字节0xe8：无效的连续字节

有什么想法吗？

1 个答案:

答案 0 :(得分：0)

该数据无效utf-8，所以如果您真的从数据库中检索到它，那么您应该检查它/谁放在那里。