我有一行字节:'\udcd0\udca0\udcd0\udcbe\udcd1\udc81\udcd0\udcbd\udcd0\udcb5\udcd1\udc84\udcd1\udc82\udcd1\udc8c'
如果我这样做:
b'\udcd0\udca0\udcd0\udcbe\udcd1'.decode("utf8"),
我接受了:
'\\udcd0\\udca0\\udcd0\\udcbe\\udcd1'
我无法解码它,因为我不知道它是如何被编码的。至少,我们可以看到,它不是utf-8
,因为我期望看到的符号具有\x23
- 类似的表示。我怎样才能发现解码器并对其进行解码?
P.S。我希望看到那里的俄罗斯符号
答案 0 :(得分:0)
我能够以这种方式打印你的字符串,但输出都是“无效字符。”
>>> string = u'\udcd0\udca0\udcd0\udcbe\udcd1\udc81\udcd0\udcbd\udcd0\udcb5\udcd1\udc84\udcd1\udc82\udcd1\udc8c'
>>> print string
����������������
根据Charbase.com,您的第一个字符(u'\ udcd0')是无效字符。所以也许输出是正确的。