Python正则表达式排除电子邮件模式,但包含@string模式

时间:2019-08-14 10:58:34

标签: python regex

考虑一下我有以下字符串:

string = "Hello, please send message to @david, @nick, @jack, but do not send message to any email address like json1234@google.com or nelson.tan@yahoo.com, thanks!"
matches = re.findall("\@\w+", string)
print(macthes)

#return ['@david', '@nick', '@jack', '@google', '@yahoo']

但是,我只想返回['@david', '@nick', '@jack']

如何排除电子邮件地址的模式,以便仅使用@返回名称标签。谢谢。

1 个答案:

答案 0 :(得分:2)

由于电子邮件在@之前包含一个字符char,因此您可以使用\B

r'\B@\w+'

\B 此处在字符串的开头匹配,或者在@之前有非单词char(_或空格以外的标点符号) )。参见regex demo

如果您知道需要提取的字符串是在空格/开始使用字符串之后

r'(?<!\S)@\w+'

如果当前位置左侧没有空格,则(?<!\S)否定超前将使匹配失败。因此,@\w+仅在字符串的开头或空格之后匹配。参见this regex demo

Python demo

import re    
s = 'Hello, please send message to @david, @nick, @jack, but do not send message to any email address like json1234@google.com or nelson.tan@yahoo.com, thanks!'
print( re.findall(r'\B@\w+', s) )
# => ['@david', '@nick', '@jack']
print( re.findall(r'(?<!\S)@\w+', s) )
# => ['@david', '@nick', '@jack']