从python中的内置未知字符替换字符串

时间:2019-04-18 02:41:09

标签: python unicode decode

我正在尝试将下面无法识别的文本替换为另一文本。我所做的就是将其解码为UTF-8,并尝试替换下面的未知文本。

“你。”

varlistlabela = spss.GetVariableLabel(var)
varlistlabela=varlistlabela.decode("cp1252").replace(r'[\u0020-\ud7ff]',"").encode("cp1252") 

1 个答案:

答案 0 :(得分:1)

您需要用正则表达式替换:

re.sub(r'[^\u0020-\ud7ff]', '', s)

其中s是输入字符串。

代码

import re

s = " you�"
print(re.sub(r'[^\u0020-\ud7ff]', '', s))
#  you