从 json 文件加载中删除非 ascii 控制字符

时间:2021-03-19 16:44:46

标签: python

我加载的 json 文件(见下文)中有不可见的控制字符,但如何删除它们?

with open('test.json',encoding='utf-8') as json_data:
     data= json.load(json_data)

但现在我有类似的文字

'help me\u00c3\u00a9r\u00c3 me'

1 个答案:

答案 0 :(得分:1)

如果你想过滤掉不可打印的字符,你可以这样做:

import string
printable = set(string.printable)
with open('test.json',encoding='utf-8') as json_data:
    s = json.load(json_data)
    data = ''.join(filter(lambda x: x in printable, s))
相关问题