如何用变音符号替换\ xc3等?

时间:2017-10-06 20:49:50

标签: python python-3.x character-encoding

我在Python中输出spannkr \xc3\xa4ftig, da\xc3\x9f unser。如何用变音符号替换它?

1 个答案:

答案 0 :(得分:2)

德语字符已经存在,但编码为utf-8。如果你想在解释器中看到变音符号等,那么你可以解码为str

>>> bs = b'spannkr \xc3\xa4ftig, da\xc3\x9f unser'
>>> s = bs.decode('utf-8')
>>> print(s)
spannkr äftig, daß unser

您可能正在处理以某种方式包含utf-8编码数据的str。在这种情况下,您需要执行额外的步骤:

>>> s = 'spannkr \xc3\xa4ftig, da\xc3\x9f unser'
>>> bs = s.encode('raw-unicode-escape')  # encode to bytes without double-encoding
>>> print(bs)
b'spannkr \xc3\xa4ftig, da\xc3\x9f unser' 
>>> decoded = bs.decode('utf-8')
>>> print(decoded)
spannkr äftig, daß unser

没有一种简单的方法可以区分错误嵌入的空格和单词之间的空格。您需要使用某种拼写检查程序或自然语言应用程序。