提取由子字符串分隔的组

时间:2013-07-20 15:32:13

标签: python regex

我有一个字符串,其中包含由特定子字符串分隔的组。类似的东西:

FOO10 F10 O20  FOO20 F11 O11

我希望在保留组标识符的同时将其拆分为组,即

FOO10 F10 O20
FOO20 F11 O11

有没有办法从单词FOO到下一个FOO的左边界或线的末端捕捉任何东西?

2 个答案:

答案 0 :(得分:3)

>>> import re
>>> re.findall('FOO.*?(?=FOO|$)', "FOO10 F10 O20 FOO20 F11 O11" )
['FOO10 F10 O20 ', 'FOO20 F11 O11']
>>> map(str.strip, re.findall('FOO.*?(?=FOO|$)', "FOO10 F10 O20 FOO20 F11 O11" ))
['FOO10 F10 O20', 'FOO20 F11 O11']

答案 1 :(得分:3)

>>> s = "FOO10 F10 O20  FOO20 F11 O11"
>>> import re
>>> regex = re.compile(r"FOO(?:(?!\s*FOO).)*")
>>> regex.findall(s)
['FOO10 F10 O20', 'FOO20 F11 O11']

<强>解释

FOO         # Match FOO
(?:         # Start of non-capturing group:
 (?!\s*FOO) # Assert that we're not right before (whitespace) FOO
 .          # Match any character
)*          # Repeat as needed