丑陋的代码:有趣的评论?

时间:2009-11-23 01:38:56

标签: python comments

这是我正在进行原型设计的代码片段,从各方面来说,它应该永远不会被看到。在将其合并到我的项目中之前,我将重构它并进行清理。

然而,它似乎正在起作用,当我正在研究时,我正好听着Arlo Guthrie。

#!/usr/bin/env python
import re

expr = re.compile(r'\[[0-9][-0-9,[]*\]')
def range2list(s):
    '''Given [x-y,a,b-c] return: range(x,y) + [a] + range(b,c)
       Handle decrements and zero-filling if necessary.

    '''
    assert s.startswith('[') and s.endswith(']') and len(s) > 2
    results = []
    r = s[1:-1]  # extract from enclosing brackets
    for i in r.split(','):  # each p
        if '-' not in i:
            results.append(i)
            continue
        # Else: (it's a range
        t = i.split('-')
        if len(t) != 2:   # punt on degenerate expressions
            results.append(i)
            continue
        # Else:
        if len(t[0]) > 1 and t[0].startswith('0'):
            fmt = "%%0%sd" % len(t[0])  ## Handle zero fill
        else:
            fmt = "%s"
        try:
            l, u = int(t[0]), int(t[1])
        except ValueError:  # punt on stuff that can't be converted
            results.append(i) # remember i? There's a song about i.
            continue
        if l > u:
            step=-1
        else:
            step=1
        results.extend([fmt % x for x in range(l,u,step)])
    return results 

......以及它的测试套件:

if __name__ == '__main__':
    import sys
    testcases = [ '[0-5]', '[1]', '[1,2,3]', '[1-3,01-3,9,9-7]',
                  '[01-20]', '[020-1]', '[a,b,c,9-]' ]
    for i in testcases:
        print 
        print  'range2list(%s)' % i
        print "\t" + ' '.join(range2list(i))

......产生:

range2list([0-5])
    0:1:2:3:4

range2list([1])
        1

range2list([1,2,3])
        1:2:3

range2list([1-3,01-3,9,9-7])
        1:2:01:02:9:9:8

range2list([01-20])
        01:02:03:04:05:06:07:08:09:10:11:12:13:14:15:16:17:18:19

range2list([020-1])
        020:019:018:017:016:015:014:013:012:011:010:009:008:007:006:005:004:003:002

range2list([a,b,c,9-])
        a:b:c:9-

我真的不喜欢那里令人费解的烂摊子(尤其是在那里我 写评论“记得我,有一首关于我的歌。

当我清理它时,我会将它合并到一个扩展主机名范围模式的函数中(ww [020-040,091,099] .sfarm.mycorp.com ...等等)。 (实际上这里显示的编译正则表达式是其他函数的一部分,它从字符串中提取[...]表达式以进行扩展)。

所以,我的问题:

  • 我该如何清理这个烂摊子?
  • 您在源代码评论中看到的最有趣,最模糊,最有趣等音乐参考是什么?
  • 有没有人写过一个解析器/扩展器已经有类似的东西?在Python?还有其他人会用这样的东西吗?是否值得单独提供?
  • 哪种替代语法有意义? '{0:9,12,23,090:099}'? ..而不是 - ?

2 个答案:

答案 0 :(得分:4)

如果您可以将当前的a-b语法(看起来很可能被负数混淆!)转换为a:b,那么Python的切片语法会为您解析 - 你会最终(例如通过带有索引方法的假类)和包含切片和标量的元组:

>>> class x(object):
...   def __getitem__(self, x): return x
... 
>>> x()[2, 3:6, 4]
(2, slice(3, 6, None), 4)

并且您可以按顺序处理该元组以生成所需的结果(通过连续附加或适当扩展以[]开头的列表。)

答案 1 :(得分:1)

我发布了这种格式here的解析器。