Python正则表达式 - 如何从通配符表达式中捕获多个组?

时间:2009-01-21 10:29:32

标签: python regex lexical-analysis

我有一个Python正则表达式,其中包含一个可以出现零次或多次的组 - 但是当我之后检索组列表时,只有最后一个存在。例如:

re.search("(\w)*", "abcdefg").groups()

这将返回列表('g',)

我需要它返回('a','b','c','d','e','f','g',)

这可能吗?我该怎么做?

2 个答案:

答案 0 :(得分:38)

re.findall(r"\w","abcdefg")

答案 1 :(得分:29)

除了Douglas Leeder's solution之外,还有以下解释:

在正则表达式中,组计数是固定的。将量词放在组后面不会增加组计数(想象所有其他组索引都会增加,因为一个更多的组匹配不止一次)。

当需要多次匹配时,具有量词的组是使复杂子表达式成为原子的方式。正则表达式引擎除了将最后一个匹配仅保存到组之外别无他法。简而言之:单一的“徒手”正则表达式无法达到你想要的效果,你必须找到另一种方式。