将正则表达式模式列表应用于字符串并返回找到的匹配项

时间:2018-12-18 07:23:27

标签: python regex list loops

我有多个正则表达式,我需要将所有正则表达式都匹配到一行,并且需要找出匹配的女巫正则表达式。

import re
re_list=['a',' b','c','\s+d']
str="a uuu d e 1 2 3"
re_pattern = re.compile( '|'.join( re_list) )

m=re.search(re_pattern, str)

但这不起作用。我正在寻找一个字典,将模式映射到匹配的子字符串。

{"a" : "a",
"\s+d": " d"}

我该怎么做?

1 个答案:

答案 0 :(得分:2)

首先,编译您的模式:

import re
ps = [re.compile(p) for p in re_list]

现在,您可以遍历它们:

d = {}
for p in ps:
    # `string` is your string. Please don't use `str` to name variables.
    m = p.search(string)
    if m:  
        d[p.pattern] = m.group()

print(d)
{'a': 'a', '\\s+d': ' d'}

可以使用列表理解功能

dict((p.pattern, p.search(s).group()) for p in ps if p.search(s))

但是您将不得不搜索两次,这很浪费。如上所示,您可以通过在模式上循环来避免这种情况。