Python regexp找到确切的单词

时间:2017-02-09 15:35:01

标签: python regex

我想从我的单词中删除某些特殊字符和一些像“& quot”这样的垃圾(但我想保留一些特殊的字符,如'é','á'等)。如何匹配EXACT模式'& quot'(或'quot',因为我可以单独删除'&')?

word = re.sub('[,|;|?|!|(|)|{|}|.|&|\bquot\b]+', '', word)

我正在试着这个,但它删除了所有'q'''''''''t'字符。

修改 按要求测试字符串:

'&quottermészet&quot' should be 'természet'    
'data,' should be 'data'

2 个答案:

答案 0 :(得分:2)

在方括号内,您不需要 | 分隔符

试试这个正则表达式

re.sub(r'[,;?!(){}.]|\&quot', '', word)

答案 1 :(得分:1)

你的意思是这样的吗?

re.sub('&quot', '', "abc&quotdef")