正则表达式匹配没有前面的字符串的字符串

时间:2017-01-17 21:17:04

标签: python regex

我正在使用python解析一些包含多行的文件,并使用re.findall()执行正则表达式。

我正在尝试将字符串与“bar”匹配,只要字符串“no foo”不在“bar”前面。换句话说 - 匹配任何“bar”但不匹配“no foo bar”。如果“bar”出现在“no foo bar”之外,那么它应该匹配。

输入:

1. candy bar 1
2. no bar stool
3. no foo bar here
4. foo barred
5. still no foo bar.
6. foo bar!
7. foobar!
8. tricky no foo bar but has bar again

期望的输出:

1. candy bar 1
2. no bar stool
4. foo barred
6. foo bar!
7. foobar!
8. tricky no foo bar but has bar again

这与我一直在尝试的表达类似,但没有取得任何成功:

(^|[^no foo ])bar

代码:

patterns = ["XXX", "(^|[^no foo ])bar"]
joinedpatterns = "|".join(patterns)
for line in lines:
   for match in re.findall(joinedpatterns, line):
       print 'found "%s"' % str(match)

1 个答案:

答案 0 :(得分:3)

你想要实现的目标被称为负面观察:

for line in lines:
    for match in re.findall('(?<!no foo )bar', line):
        print('found "%s"' % str(line))