我在使用模式中的多个捕获组的re.finditer构建一个正常工作且正确的模式时遇到了问题。我有以下字符串,我想搜索数据。
search_string="""
option.Map['2015'] = new CG.New.Option('text1', '2015', 100, 200);
option.Map['2016'] = new CG.New.Option('text2', '2016', 150, 210);
option.Map['2017'] = new CG.New.Option('text3', '2017', 160, 260);
"""
我想使用Python正则表达式来提取文本,年份和数字。我的模式如下所示:
pattern=r"option.Map\[\'(.*)\'] = new CG\.New\.Option\(\'(.*)\',\'(.*)\',(.*),(.*)\);"
我的代码如下所示:
for finding in re.finditer(pattern,search_string):
print(finding.group(1))
print(finding.group(2))
print(finding.group(3))
print(finding.group(4))
print(finding.group(5))
我知道我的模式已关闭,但我不知道为什么。
我期望/希望实现的输出如下所示:
2015
text1
2015
100
200
2016
text2
2016
150
210
2017
text3
2017
160
260
答案 0 :(得分:1)
您需要考虑数字后面的空格,例如:
import re
search_string = """
option.Map['2015'] = new CG.New.Option('text1', '2015', 100, 200);
option.Map['2016'] = new CG.New.Option('text2', '2016', 150, 210);
option.Map['2017'] = new CG.New.Option('text3', '2017', 160, 260);
"""
pattern = r"option.Map\['(.*?)'\] = new CG.New.Option\('(.*?)', '(.*?)', (\d+), (\d+)\);"
然后:
for match in re.finditer(pattern, search_string):
print(*match.groups(), sep='\n')
给你:
2015
text1
2015
100
200
2016
text2
2016
150
210
2017
text3
2017
160
260