有没有人知道使用python组合正则表达式的好方法?

时间:2018-04-11 19:51:46

标签: python regex

我是编程新手,但已经进行了广泛的搜索,我似乎找不到任何东西让我走上正轨。我有一大堆正则表达式。如果可能的话,我需要找到一种方法来组合它们。我的正则表达式只是数字

例如,我的列表看起来像这样

832118[0-3]
832118[7-8]
832119[0-1]
832119[4-6]
832119[8-9]
8321206
832120[0-4]
832120[8-9]

我想要的输出看起来像这样

832118[0-37-8]
832119[0-14-68-9]
832120[0-468-9]

感谢您提供的任何提示!

  

块引用

1 个答案:

答案 0 :(得分:1)

使用defaultdict和这个简单的正则表达式:(\d+)\[(\d+-\d+)\]

如果您想匹配Numbers[Numbers-Numbers]以外的格式,则必须更改正则表达式。

import re
from collections import defaultdict
dct = defaultdict(str)
data = ['832118[0-3]', '832118[7-8]', '832119[0-1]', '832119[4-6]', '832119[8-9]', '8321206', '832120[0-4]', '832120[8-9]']
for line in data:
    mtch = re.findall(r"(\d+)\[(\d+-\d+)\]", line)
    if mtch:
        dct[mtch[0][0]] += mtch[0][1]

for i, j in dct.items():
    print(i, '['+ j + ']')

输出:

832118 [0-37-8]
832120 [0-48-9]
832119 [0-14-68-9]