我有一个简单的问题。我正在尝试用空白或什么都不替换诸如'/ xe3'或'/ x99'之类的模式
重新导入
t = re.sub(r'\ x [a-z] [0-9] | \ x [0-9] [0-9]','', 'guy \ xe2 \ x80 \ xa6 \ xe2 \ x80 \ xa6realdonaldtrump')
打印(t)
但获得以下结果 guyΓÇΓΓǪrealdonaldtrump
我如何摆脱“ΓǪ”?
谢谢
答案 0 :(得分:2)
您当前的脚本甚至没有为我运行,但是如果您只想剥离所有十六进制字符,请尝试删除所有非ASCII的十六进制字符:
t = re.sub(r'[^\x00-\x7f]+', ' ', 'guy\xe2\x80\xa6\xe2\x80\xa6realdonaldtrump')
print(t)
guy realdonaldtrump