有效地迭代python嵌套列表

时间:2013-06-09 21:10:03

标签: python nested-lists

我正在使用Python进行网络流量监控项目。不熟悉Python,所以我在这里寻求帮助。

简而言之,我正在检查流量和流量,我这样写道:

for iter in ('in','out'):
        netdata = myhttp()
        print data

netdata是一个由嵌套列表组成的列表,其格式如下:

[ [t1,f1], [t2,f2], ...]

此处t表示时刻,f表示流量。但是我只想在这个时刻保留这些f进行内外,我想知道如何获得有效的代码。

经过一些搜索,我认为我需要使用创建流量列表(2个元素),然后使用zip函数同时迭代这两个列表,但是我很难写出正确的列表。由于我的netdata是一个很长的列表,效率也非常重要。

如果有任何令人困惑的事情,请告诉我,我会尽力澄清。 谢谢你的帮助

3 个答案:

答案 0 :(得分:11)

除了代码的小修复(@Zero Piraeus提出的问题)之外,您的问题可能已经回答here。遍历N度(树)列表的可能代码如下:

def traverse(item):
    try:
        for i in iter(item):
            for j in traverse(i):
                yield j
    except TypeError:
        yield item

示例:

l = [1, [2, 3], [4, 5, [[6, 7], 8], 9], 10]
print [i for i in traverse(l)]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

使其工作的关键是递归,使其有效工作的关键是使用生成器(关键字yield给出提示)。生成器将遍历您的列表列表,逐项返回给您,无需复制数据或创建全新列表(除非您使用整个生成器将结果分配给列表,如我的示例中所示)

使用迭代器和生成器可以理解奇怪的概念(主要是关键字yield)。查看此great answer以完全理解它们

答案 1 :(得分:1)

您展示的代码并没有多大意义。这是它的作用:

  • 遍历序列'in', 'out',将这两个字符串中的每一个依次分配给变量iter(屏蔽过程中的内置函数iter())两次通过循环。

  • 完全忽略循环中iter的值。

  • 通过循环将myhttp()的结果分配给每次传递上的变量netdata

  • 完全忽略netdata的值,而是尝试在每次循环中打印未定义的变量data

考虑到你描述的嵌套列表,你可能需要这样的东西:

for t, f in myhttp():
    print t
    print f
    # ... or whatever you want to do with those values.

答案 2 :(得分:0)

当尝试其他答案时,该函数无法递归,因此我将其修改为不递归。它仍然可以很快地运行,并且可以处理大型嵌套列表(至少就我的测试而言)。它只是一个Python 3功能。

# Originally by Bruno Polaco
def traverse(item, reverse=False):
    its = [item] #stack of items to-be-processed
    out = [] # Output (no longer generator)
    ite = False
    while len(its) > 0:
        it = its.pop()
        try: # Check if item is iterable
            iter(it)
            ite = not isinstance(it, str)
        except TypeError:
            ite = False
        if ite: # Do something with it
            for i in it:
                its.append(i)
        else:
            out.append(it)
    if not reverse:
        out.reverse()
    return out