在python中将字节解码为字符串

时间:2016-11-05 21:26:03

标签: python byte

我有一行字节:'\udcd0\udca0\udcd0\udcbe\udcd1\udc81\udcd0\udcbd\udcd0\udcb5\udcd1\udc84\udcd1\udc82\udcd1\udc8c'

如果我这样做:

b'\udcd0\udca0\udcd0\udcbe\udcd1'.decode("utf8"),

我接受了:

'\\udcd0\\udca0\\udcd0\\udcbe\\udcd1'

我无法解码它,因为我不知道它是如何被编码的。至少,我们可以看到,它不是utf-8,因为我期望看到的符号具有\x23 - 类似的表示。我怎样才能发现解码器并对其进行解码?

P.S。我希望看到那里的俄罗斯符号

1 个答案:

答案 0 :(得分:0)

我能够以这种方式打印你的字符串,但输出都是“无效字符。”

>>> string = u'\udcd0\udca0\udcd0\udcbe\udcd1\udc81\udcd0\udcbd\udcd0\udcb5\udcd1\udc84\udcd1\udc82\udcd1\udc8c'
>>> print string
����������������

根据Charbase.com,您的第一个字符(u'\ udcd0')是无效字符。所以也许输出是正确的。