清除“不良”字符的更干净方法?

时间:2018-12-11 00:09:25

标签: python python-3.x python-unicode

我正在抓取一堆可以包含Unicode文本的数据,并将其输出到仅了解cp1252的朴素Windows终端。目前,我正在通过以下方式对这一输入进行消毒(有些人可能会说绝口!):

data = data.encode(encoding='cp1252', errors='backslashreplace').decode()

但是,编码为字节仅解码回字符串似乎几乎是浪费的。是否有一次通过操作会产生相同的结果?

0 个答案:

没有答案