想在字符串中找到以下模式:
word-word-word++
或-word-word-word++
这样它就会迭代-word
或word-
模式,直到子字符串结束。
字符串非常大,包含许多带有^模式的单词。 已尝试以下方法:
p = re.compile('(?:\w+\-)*\w+\s+=', re.IGNORECASE)
result = p.match(data)
但它返回NONE。有谁知道答案?
答案 0 :(得分:1)
你的正则表达式只匹配第一个模式,match()只会找到一个匹配项,只有紧接着它后面跟着一些空格和等号。
此外,在您的示例中,您暗示您想要三个或更多单词,因此这里是一个通过以下方式更改的版本:
-?
){2,}
而不是+
)\b
与单词边界匹配。这里没有必要,因为前面的\w+
保证我们无论如何都处于单词边界)以下是代码:
#!/usr/bin/python
import re
data=r"foo-bar-baz not-this -this-neither nope double-dash--so-nope -yeah-this-even-at-end-of-string"
p = re.compile(r'-?(?:\w+-){2,}\w+\b', re.IGNORECASE)
print p.findall(data)
# prints ['foo-bar-baz', '-yeah-this-even-at-end-of-string']