我想从我的单词中删除某些特殊字符和一些像“& quot”这样的垃圾(但我想保留一些特殊的字符,如'é','á'等)。如何匹配EXACT模式'& quot'(或'quot',因为我可以单独删除'&')?
word = re.sub('[,|;|?|!|(|)|{|}|.|&|\bquot\b]+', '', word)
我正在试着这个,但它删除了所有'q'''''''''t'字符。
修改 按要求测试字符串:
'"természet"' should be 'természet'
'data,' should be 'data'
答案 0 :(得分:2)
在方括号内,您不需要 | 分隔符
试试这个正则表达式
re.sub(r'[,;?!(){}.]|\"', '', word)
答案 1 :(得分:1)
你的意思是这样的吗?
re.sub('"', '', "abc"def")