从python中的字符串中删除奇怪的字符

时间:2017-02-21 09:31:24

标签: python replace

我必须解析从网络上获取的一些网络数据。网络内容很可能是我正在处理的任何问题的不同区域语言。但是在某些字符串中出现了一些无效字符,如

  

我很开心   8qîÚ4½-ôMºÝCQ'Dɬ)问+ R±}Ûýï7üÛ²ëlY&安培; 53 |8ïôóg/ ^ÿûêþIA#ï?¼ºy{5+B^ß¿ß~¾¿½|ÓûÆk.c¹~WÚ@ë¤KÈh4rF? !-G|¹ÿ¬|a〜μuÓñμ_»| THI   每日统计学

我必须删除这样的奇怪字符和onyl提取有效字符串。我正在使用python。我用utf-8编码每个字符串。

1 个答案:

答案 0 :(得分:1)

如果你的意思不是奇怪的,你可以尝试:

import string
"".join(filter(lambda char: char in string.printable, s))

其中s是你的字符串。 以下是一些可以过滤的字符串常量: https://docs.python.org/3/library/string.html