我加载的 json 文件(见下文)中有不可见的控制字符,但如何删除它们?
with open('test.json',encoding='utf-8') as json_data:
data= json.load(json_data)
但现在我有类似的文字
'help me\u00c3\u00a9r\u00c3 me'
答案 0 :(得分:1)
如果你想过滤掉不可打印的字符,你可以这样做:
import string
printable = set(string.printable)
with open('test.json',encoding='utf-8') as json_data:
s = json.load(json_data)
data = ''.join(filter(lambda x: x in printable, s))