我必须解析从网络上获取的一些网络数据。网络内容很可能是我正在处理的任何问题的不同区域语言。但是在某些字符串中出现了一些无效字符,如
我很开心 8qîÚ4½-ôMºÝCQ'Dɬ)问+ R±}Ûýï7üÛ²ëlY&安培; 53 |8ïôóg/ ^ÿûêþIA#ï?¼ºy{5+B^ß¿ß~¾¿½|ÓûÆk.c¹~WÚ@ë¤KÈh4rF? !-G|¹ÿ¬|a〜μuÓñμ_»| THI 每日统计学
我必须删除这样的奇怪字符和onyl提取有效字符串。我正在使用python。我用utf-8编码每个字符串。
答案 0 :(得分:1)
如果你的意思不是奇怪的,你可以尝试:
import string
"".join(filter(lambda char: char in string.printable, s))
其中s是你的字符串。 以下是一些可以过滤的字符串常量: https://docs.python.org/3/library/string.html