我有一长串的数字格式如下:
["4450[0-9]", "6148[0-9][0-9]"]
我想从其中一个系列中列出一个列表:
[44500,44501,..., 44509]
我需要在原始列表中的许多系列中执行此操作,并且我想知道这样做的最佳方法是什么?
答案 0 :(得分:2)
可能不是最佳解决方案,但您可以递归方式查找[x-y]
范围和generating值(在这种情况下使用yield
和yield from
,因此Python 3.3 +):
import re
pattern = re.compile(r"\[(\d+)-(\d+)\]")
def get_range(s):
matches = pattern.search(s)
if not matches:
yield int(s)
else:
start, end = matches.groups()
for i in range(int(start), int(end) + 1):
repl = pattern.sub(str(i), s, 1)
yield from get_range(repl)
for item in get_range("6148[0-9][0-9]"):
print(item)
打印:
614800
614801
...
614898
614899
答案 1 :(得分:1)
def invertRE(x):
if not x:
yield []
else:
idx = 1 if not x.startswith("[") else x.index("]") + 1
for rest in invertRE(x[idx:]):
if x.startswith("["):
v1,v2 = map(int,x[1:idx-1].split("-"))
for i in range(v1,v2+1):
yield [str(i),]+rest
else:
yield [x[0],] + rest
print(map("".join,invertRE("123[4-7][7-8]")))
我很确定这会有用......但是你真的应该在来这里之前自己尝试一下......
答案 2 :(得分:0)
发现这个模块似乎做了我想做的事。
https://pypi.python.org/pypi/braceexpand/0.1.1
>>> from braceexpand import braceexpand
>>> s = "1[0-2]"
>>> ss = "1[0-2][0-9]"
>>> list(braceexpand(s.replace("[", "{").replace("-","..").replace("]","}")))
['10', '11', '12']
>>> list(braceexpand(ss.replace("[", "{").replace("-","..").replace("]","}")))
['100', '101', '102', '103', '104', '105', '106', '107', '108', '109', '110', '111', '112', '113', '114', '115', '116', '117', '118', '119', '120', '121', '122', '123', '124', '125', '126', '127', '128', '129']
alecxe的答案仍然是“最佳”答案而不是短语