Python Re:多个捕获组

时间:2017-05-09 20:49:37

标签: python-3.x regex-group capturing-group

我在使用模式中的多个捕获组的re.finditer构建一个正常工作且正确的模式时遇到了问题。我有以下字符串,我想搜索数据。

search_string="""
option.Map['2015'] = new CG.New.Option('text1', '2015', 100, 200);
option.Map['2016'] = new CG.New.Option('text2', '2016', 150, 210);
option.Map['2017'] = new CG.New.Option('text3', '2017', 160, 260);
"""

我想使用Python正则表达式来提取文本,年份和数字。我的模式如下所示:

pattern=r"option.Map\[\'(.*)\'] = new CG\.New\.Option\(\'(.*)\',\'(.*)\',(.*),(.*)\);"

我的代码如下所示:

for finding in re.finditer(pattern,search_string):
    print(finding.group(1))
    print(finding.group(2))
    print(finding.group(3))
    print(finding.group(4))
    print(finding.group(5))

我知道我的模式已关闭,但我不知道为什么。

我期望/希望实现的输出如下所示:

2015
text1
2015
100
200
2016
text2
2016
150
210
2017
text3
2017
160
260

1 个答案:

答案 0 :(得分:1)

您需要考虑数字后面的空格,例如:

import re

search_string = """
option.Map['2015'] = new CG.New.Option('text1', '2015', 100, 200);
option.Map['2016'] = new CG.New.Option('text2', '2016', 150, 210);
option.Map['2017'] = new CG.New.Option('text3', '2017', 160, 260);
"""

pattern = r"option.Map\['(.*?)'\] = new CG.New.Option\('(.*?)', '(.*?)', (\d+), (\d+)\);"

然后:

for match in re.finditer(pattern, search_string):
    print(*match.groups(), sep='\n')

给你:

2015
text1
2015
100
200
2016
text2
2016
150
210
2017
text3
2017
160
260