转换嵌套列表推导以在python中使用itertools链

时间:2016-02-27 22:40:42

标签: python python-2.7 list-comprehension itertools

受到Making a flat list out of list of lists in Python中讨论的启发,我尝试将其转换(在some_directory中获取文件和文件夹修改时间):

c = [os.path.getmtime(item) for root, d, files in os.walk(some_directory)
        for item in [root] + map(lambda fi: os.path.join(root, fi), files)]

使用itertools.chain:

c = map(os.path.getmtime,
        itertools.chain.from_iterable([root] + map(lambda fi: join(root, fi), files)
                                      for root, d, files in os.walk(some_directory)))

但是我的分析显示它更慢并且看起来并不优雅。

那么在这种情况下如何使用链,那我怎样才能更优雅(更快)地生成中间列表呢?

或者我的案例还有其他一些itertools函数吗?

编辑:

散列分析脚本:

import timeit

repeat = 10

setup ="""
import itertools
import os

join = os.path.join
path = r'C:\Dropbox\eclipse_workspaces'
c = []
"""


print "Original             ", min(timeit.Timer("""[c.extend([join(root,dir) for dir in dirs] + [join(root,file) for file in files]) for root,dirs,files in os.walk(path)]""",
                       setup=setup).repeat(3, repeat))
print "For loop             ", min(timeit.Timer("""for root, d, files in os.walk(path):
    c.append(root)
    c.extend(join(root, fi) for fi in files)""",
                       setup=setup).repeat(3, repeat))
print "Comprehension        ", min(timeit.Timer('[item for r, d, f in os.walk(path) for item in [r] + map(lambda f: join(r, f), f)]',
                       setup=setup).repeat(3, repeat))
print "Comprehension + chain", min(timeit.Timer('[item for r, d, f in os.walk(path) for item in itertools.chain.from_iterable(([r], map(lambda fi: join(r, fi), f)))]',
                       setup=setup).repeat(3, repeat))
print "Itertools            ", min(timeit.Timer("""[j for j in itertools.chain.from_iterable([root] + map(lambda fi: join(root, fi), files)
                                      for root, d, files in os.walk(path))]""",
                       setup=setup).repeat(3, repeat))

似乎没有什么区别,但我在分析时有一些奇怪的文物,所以我不发布任何结果。我仍然对可以完成的最快方式感兴趣,最好使用itertools

1 个答案:

答案 0 :(得分:2)

我认为在这里使用chain并不合理。当扁平化是它正在取代的理解的整个点时,chain是最有用的。如果你正在做更复杂的事情,那么坚持理解或生成器表达可能更容易。或者甚至将结构解压缩到显式的for循环中,这可能会让你避免使用当前代码中的列表连接之类的东西:

c = []
for root, d, files in os.walk(some_directory):
    c.append(root)
    c.extend(join(root, fi) for fi in files)