我已经得到了一个UCS-2编码的xml文档,我已经设法在经过一些调整后基于minidom构建了一个DOM。
问题是我应该在base64上编码一些数据。我知道一个事实:
AME= (or \x00A\x00M\x00E\x00=) is base64 code for Á
我如何解码?
http://www.fileformat.info/info/unicode/char/00c1/index.htm表明Á的unicode表示形式为:u“\ u00C1”和UTF-16:0x00C1
base64.b64decode('AME=').decode('UTF-16')
显示
u'\uc100'
作为字符的unicode表示,但它看起来是字节交换的。
关于如何解码的任何想法?
答案 0 :(得分:15)
检查出来
>>> import base64
>>> base64.b64decode('AME=').decode('UTF-16')
u'\uc100'
>>> base64.b64decode('AME=').decode('UTF-16LE')
u'\uc100'
>>> base64.b64decode('AME=').decode('UTF-16BE')
u'\xc1'
也许您正在寻找大端解码?