考虑一下我有以下字符串:
string = "Hello, please send message to @david, @nick, @jack, but do not send message to any email address like json1234@google.com or nelson.tan@yahoo.com, thanks!"
matches = re.findall("\@\w+", string)
print(macthes)
#return ['@david', '@nick', '@jack', '@google', '@yahoo']
但是,我只想返回['@david', '@nick', '@jack']
如何排除电子邮件地址的模式,以便仅使用@返回名称标签。谢谢。
答案 0 :(得分:2)
由于电子邮件在@
之前包含一个字符char,因此您可以使用\B
:
r'\B@\w+'
\B
此处在字符串的开头匹配,或者在@
之前有非单词char(_
或空格以外的标点符号) )。参见regex demo。
如果您知道需要提取的字符串是在空格/开始使用字符串之后
r'(?<!\S)@\w+'
如果当前位置左侧没有空格,则(?<!\S)
否定超前将使匹配失败。因此,@\w+
仅在字符串的开头或空格之后匹配。参见this regex demo。
import re
s = 'Hello, please send message to @david, @nick, @jack, but do not send message to any email address like json1234@google.com or nelson.tan@yahoo.com, thanks!'
print( re.findall(r'\B@\w+', s) )
# => ['@david', '@nick', '@jack']
print( re.findall(r'(?<!\S)@\w+', s) )
# => ['@david', '@nick', '@jack']