我有:
string = 'Here it is, your gif! am a bot. [^(Report an issue)] ❤ that bot,I ❤ ur mom **YEET** ,GOTTEM!"'
然后我尝试:
string = re.sub(r'\W+', ' ', string)
那给了我:
'Here it is your gif am a bot Report an issue that bot I ur mom YEET GOTTEM'
但是我想要这样:
'Here it is, your gif! am a bot. (Report an issue) that bot,I ur mom YEET ,GOTTEM!"'
只有26个字母,没有数字,只有该组中最常用的符号:.,()'"?!
答案 0 :(得分:3)
对要接受的事物进行字符分类(用Role
并反转(用前导User
使其变成[]
):
^
答案 1 :(得分:1)
将其用于您的正则表达式:[^stuff]
小节定义了您要选择的元素的集合,最前面的插入号定义了对内部元素的否定。
因此离开你
string = re.sub(r'[^a-zA-Z.,()\'"?! ]+', '', string)