解析可选的范围列表

时间:2016-08-21 10:50:57

标签: python argparse

我的脚本需要选择一个选项,后跟一个页面列表,指定为以逗号分隔的范围列表,并处理扩展的页面列表。所以,例如,

script.py -a 2,4-6,9,10-13

应该获取列表

[2, 4, 5, 6, 9, 10, 11, 12, 13]

与之合作。目前我这样做:

import argparse

def getList(argument):
    ranges = list(argument.split(","))
    newRange = []
    for theRange in ranges:
        subRange = list(map(int, theRange.split("-")))
        if (len(subRange) > 1):
            newRange.extend(range(subRange[0], subRange[1] + 1))
        else:
            newRange.extend(subRange)
    newRange.sort()
    return newRange

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("-a", "--pages", type=getList, dest="pages", default=[], help="pages to process")
    args = parser.parse_args()

它有效,但我对这个Python的东西比较新,并且想知道是否有更好的方法可以做到这一点?

编辑:我不明白为什么它被标记为重复的问题。 将其标记为重复的问题的答案完全按照我上面的描述进行。想法是来处理一个简单的空格或逗号分隔的参数列表,但更复杂的东西 - 一个必须扩展的范围列表。

1 个答案:

答案 0 :(得分:1)

这是一个解决方案。它不一定是最好的。特别是,可能有更高性能的版本涉及链式迭代器而不是嵌套迭代器。

假设:

>>> range='2,4-6,9,10-13'

您可以执行以下操作:

>>> result = [range(int(y[0]), int(y[1])+1) 
... for y in [(x.split('-') + [x])[:2]
... for x in r.split(',')]]

哪个可以帮到你:

>>> result
[[2], [4, 5, 6], [9], [10, 11, 12, 13]]

如果我们解开那些理解,那么最里面的一个迭代:

>>> range.split(',')
['2', '4-6', '9', '10-13']

第二个是:

>>> result = range.split(',')
>>> [(x.split('-') + [x])[:2] for x in result]
[['2', '2'], ['4', '6'], ['9', '9'], ['10', '13']]

表达式(x.split('-') + [x])[:2]确保我们有一个两项目列表,即使对于单个数字,我们也可以将其传递给range函数。

最后,我们迭代结果:

>>> [range(int(y[0]), int(y[1])+1) for y in <the result from the rpevious operation]

哪个是显而易见的。根据列表[2, 2],我们会调用range(2, 3)给我们[2]。应用于前一个操作的所有结果,这可以得到我们之前看到的结果:

[[2], [4, 5, 6], [9], [10, 11, 12, 13]]

现在您的问题是&#34;如何压缩列表&#34;,哪一个解决方案(来自here):

>>> import itertools
>>> list(itertools.chain.from_iterable(result))
[2, 4, 5, 6, 9, 10, 11, 12, 13]