是否可以获得所有重叠匹配,这些匹配从同一索引开始,但来自不同的匹配组?
e.g。当我从“ABC”寻找模式“(A)|(AB)”时,正则表达式应返回以下匹配:
(0,“A”)和(0,“AB”)
答案 0 :(得分:6)
有一种可能性,请参阅Evpok的答案。您的问题的第二种解释可能是您想要从同一位置同时匹配所有模式。在这种情况下,您可以使用超前表达式。例如。正则表达式
(?=(A))(?=(AB))
将为您提供所需的结果(即两个模式与组匹配的所有位置)。
更新:通过一个正则表达式,仍可以进行额外的说明。您只需将两个组都设置为可选,即
(?=(A))?(?=(AB))?(?:(?:A)|(?:AB))
尽管如此我不建议这样做。您可以更轻松地分别查找每个模式,然后加入结果。
string = "AABAABA"
result = [(g.start(), g.group()) for g in re.compile('A').finditer(string)]
result += [(g.start(), g.group()) for g in re.compile('AB').finditer(string)]
答案 1 :(得分:3)
我得到了这个,但我记不起在哪里或来自谁
def myfindall(regex, seq):
resultlist = []
pos = 0
while True:
result = regex.search(seq, pos)
if result is None:
break
resultlist.append(seq[result.start():result.end()])
pos = result.start() + 1
return resultlist
它返回所有(甚至重叠)匹配的列表,每个索引的限制不超过一个匹配。