如何使python正则表达式将多个模式匹配到相同的索引

时间:2011-05-23 17:40:25

标签: python regex match overlapping

是否可以获得所有重叠匹配,这些匹配从同一索引开始,但来自不同的匹配组?

e.g。当我从“ABC”寻找模式“(A)|(AB)”时,正则表达式应返回以下匹配:

(0,“A”)和(0,“AB”)

2 个答案:

答案 0 :(得分:6)

有一种可能性,请参阅Evpok的答案。您的问题的第二种解释可能是您想要从同一位置同时匹配所有模式。在这种情况下,您可以使用超前表达式。例如。正则表达式

(?=(A))(?=(AB))

将为您提供所需的结果(即两个模式与组匹配的所有位置)。

更新:通过一个正则表达式,仍可以进行额外的说明。您只需将两个组都设置为可选,即

(?=(A))?(?=(AB))?(?:(?:A)|(?:AB))

尽管如此我不建议这样做。您可以更轻松地分别查找每个模式,然后加入结果。

string = "AABAABA"
result = [(g.start(), g.group()) for g in re.compile('A').finditer(string)]
result += [(g.start(), g.group()) for g in re.compile('AB').finditer(string)]

答案 1 :(得分:3)

我得到了这个,但我记不起在哪里或来自谁

def myfindall(regex, seq):
    resultlist = []
    pos = 0
    while True:
        result = regex.search(seq, pos)
        if result is None:
            break
        resultlist.append(seq[result.start():result.end()])
        pos = result.start() + 1
    return resultlist

它返回所有(甚至重叠)匹配的列表,每个索引的限制不超过一个匹配。