在尝试解码HBase中的值时,我看到了一个错误,但很明显Python认为它不是UTF-8格式,而是将数据放入HBase的Java应用程序只用UTF-8编码它< / p>
a =&#39; \ x00 \ x00 \ x00 \ x00 \ x10j \ x00 \ x00 \ x07 \ xe8 \ x02Y&#39; a.decode(&#34; UTF-8&#34) Traceback(最近一次调用最后一次): 文件&#34;&#34;,第1行,in 文件&#34; /System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py" ;,第16行,解码 return codecs.utf_8_decode(input,errors,True) UnicodeDecodeError:&#39; utf8&#39;编解码器不能解码位置9中的字节0xe8:无效的连续字节
有什么想法吗?
答案 0 :(得分:0)
该数据无效utf-8,所以如果您真的从数据库中检索到它,那么您应该检查它/谁放在那里。