标签: python python-3.x python-unicode
我正在抓取一堆可以包含Unicode文本的数据,并将其输出到仅了解cp1252的朴素Windows终端。目前,我正在通过以下方式对这一输入进行消毒(有些人可能会说绝口!):
data = data.encode(encoding='cp1252', errors='backslashreplace').decode()
但是,编码为字节仅解码回字符串似乎几乎是浪费的。是否有一次通过操作会产生相同的结果?