我有一个字符串,其中包含由特定子字符串分隔的组。类似的东西:
FOO10 F10 O20 FOO20 F11 O11
我希望在保留组标识符的同时将其拆分为组,即
FOO10 F10 O20
FOO20 F11 O11
有没有办法从单词FOO到下一个FOO的左边界或线的末端捕捉任何东西?
答案 0 :(得分:3)
>>> import re
>>> re.findall('FOO.*?(?=FOO|$)', "FOO10 F10 O20 FOO20 F11 O11" )
['FOO10 F10 O20 ', 'FOO20 F11 O11']
>>> map(str.strip, re.findall('FOO.*?(?=FOO|$)', "FOO10 F10 O20 FOO20 F11 O11" ))
['FOO10 F10 O20', 'FOO20 F11 O11']
答案 1 :(得分:3)
>>> s = "FOO10 F10 O20 FOO20 F11 O11"
>>> import re
>>> regex = re.compile(r"FOO(?:(?!\s*FOO).)*")
>>> regex.findall(s)
['FOO10 F10 O20', 'FOO20 F11 O11']
<强>解释强>
FOO # Match FOO
(?: # Start of non-capturing group:
(?!\s*FOO) # Assert that we're not right before (whitespace) FOO
. # Match any character
)* # Repeat as needed