这是我正在进行原型设计的代码片段,从各方面来说,它应该永远不会被看到。在将其合并到我的项目中之前,我将重构它并进行清理。
然而,它似乎正在起作用,当我正在研究时,我正好听着Arlo Guthrie。
#!/usr/bin/env python
import re
expr = re.compile(r'\[[0-9][-0-9,[]*\]')
def range2list(s):
'''Given [x-y,a,b-c] return: range(x,y) + [a] + range(b,c)
Handle decrements and zero-filling if necessary.
'''
assert s.startswith('[') and s.endswith(']') and len(s) > 2
results = []
r = s[1:-1] # extract from enclosing brackets
for i in r.split(','): # each p
if '-' not in i:
results.append(i)
continue
# Else: (it's a range
t = i.split('-')
if len(t) != 2: # punt on degenerate expressions
results.append(i)
continue
# Else:
if len(t[0]) > 1 and t[0].startswith('0'):
fmt = "%%0%sd" % len(t[0]) ## Handle zero fill
else:
fmt = "%s"
try:
l, u = int(t[0]), int(t[1])
except ValueError: # punt on stuff that can't be converted
results.append(i) # remember i? There's a song about i.
continue
if l > u:
step=-1
else:
step=1
results.extend([fmt % x for x in range(l,u,step)])
return results
......以及它的测试套件:
if __name__ == '__main__':
import sys
testcases = [ '[0-5]', '[1]', '[1,2,3]', '[1-3,01-3,9,9-7]',
'[01-20]', '[020-1]', '[a,b,c,9-]' ]
for i in testcases:
print
print 'range2list(%s)' % i
print "\t" + ' '.join(range2list(i))
......产生:
range2list([0-5])
0:1:2:3:4
range2list([1])
1
range2list([1,2,3])
1:2:3
range2list([1-3,01-3,9,9-7])
1:2:01:02:9:9:8
range2list([01-20])
01:02:03:04:05:06:07:08:09:10:11:12:13:14:15:16:17:18:19
range2list([020-1])
020:019:018:017:016:015:014:013:012:011:010:009:008:007:006:005:004:003:002
range2list([a,b,c,9-])
a:b:c:9-
我真的不喜欢那里令人费解的烂摊子(尤其是在那里我 写评论“记得我,有一首关于我的歌。”
当我清理它时,我会将它合并到一个扩展主机名范围模式的函数中(ww [020-040,091,099] .sfarm.mycorp.com ...等等)。 (实际上这里显示的编译正则表达式是其他函数的一部分,它从字符串中提取[...]表达式以进行扩展)。
所以,我的问题:
答案 0 :(得分:4)
如果您可以将当前的a-b
语法(看起来很可能被负数混淆!)转换为a:b
,那么Python的切片语法会为您解析 - 你会最终(例如通过带有索引方法的假类)和包含切片和标量的元组:
>>> class x(object):
... def __getitem__(self, x): return x
...
>>> x()[2, 3:6, 4]
(2, slice(3, 6, None), 4)
并且您可以按顺序处理该元组以生成所需的结果(通过连续附加或适当扩展以[]
开头的列表。)
答案 1 :(得分:1)
我发布了这种格式here的解析器。