我是编程新手,但已经进行了广泛的搜索,我似乎找不到任何东西让我走上正轨。我有一大堆正则表达式。如果可能的话,我需要找到一种方法来组合它们。我的正则表达式只是数字
例如,我的列表看起来像这样
832118[0-3]
832118[7-8]
832119[0-1]
832119[4-6]
832119[8-9]
8321206
832120[0-4]
832120[8-9]
我想要的输出看起来像这样
832118[0-37-8]
832119[0-14-68-9]
832120[0-468-9]
感谢您提供的任何提示!
块引用
答案 0 :(得分:1)
使用defaultdict和这个简单的正则表达式:(\d+)\[(\d+-\d+)\]
如果您想匹配Numbers[Numbers-Numbers]
以外的格式,则必须更改正则表达式。
import re
from collections import defaultdict
dct = defaultdict(str)
data = ['832118[0-3]', '832118[7-8]', '832119[0-1]', '832119[4-6]', '832119[8-9]', '8321206', '832120[0-4]', '832120[8-9]']
for line in data:
mtch = re.findall(r"(\d+)\[(\d+-\d+)\]", line)
if mtch:
dct[mtch[0][0]] += mtch[0][1]
for i, j in dct.items():
print(i, '['+ j + ']')
输出:
832118 [0-37-8]
832120 [0-48-9]
832119 [0-14-68-9]