受到Making a flat list out of list of lists in Python中讨论的启发,我尝试将其转换(在some_directory中获取文件和文件夹修改时间):
c = [os.path.getmtime(item) for root, d, files in os.walk(some_directory)
for item in [root] + map(lambda fi: os.path.join(root, fi), files)]
使用itertools.chain:
c = map(os.path.getmtime,
itertools.chain.from_iterable([root] + map(lambda fi: join(root, fi), files)
for root, d, files in os.walk(some_directory)))
但是我的分析显示它更慢并且看起来并不优雅。
那么在这种情况下如何使用链,那我怎样才能更优雅(更快)地生成中间列表呢?
或者我的案例还有其他一些itertools函数吗?
编辑:
散列分析脚本:
import timeit
repeat = 10
setup ="""
import itertools
import os
join = os.path.join
path = r'C:\Dropbox\eclipse_workspaces'
c = []
"""
print "Original ", min(timeit.Timer("""[c.extend([join(root,dir) for dir in dirs] + [join(root,file) for file in files]) for root,dirs,files in os.walk(path)]""",
setup=setup).repeat(3, repeat))
print "For loop ", min(timeit.Timer("""for root, d, files in os.walk(path):
c.append(root)
c.extend(join(root, fi) for fi in files)""",
setup=setup).repeat(3, repeat))
print "Comprehension ", min(timeit.Timer('[item for r, d, f in os.walk(path) for item in [r] + map(lambda f: join(r, f), f)]',
setup=setup).repeat(3, repeat))
print "Comprehension + chain", min(timeit.Timer('[item for r, d, f in os.walk(path) for item in itertools.chain.from_iterable(([r], map(lambda fi: join(r, fi), f)))]',
setup=setup).repeat(3, repeat))
print "Itertools ", min(timeit.Timer("""[j for j in itertools.chain.from_iterable([root] + map(lambda fi: join(root, fi), files)
for root, d, files in os.walk(path))]""",
setup=setup).repeat(3, repeat))
似乎没有什么区别,但我在分析时有一些奇怪的文物,所以我不发布任何结果。我仍然对可以完成的最快方式感兴趣,最好使用itertools
答案 0 :(得分:2)
我认为在这里使用chain
并不合理。当扁平化是它正在取代的理解的整个点时,chain
是最有用的。如果你正在做更复杂的事情,那么坚持理解或生成器表达可能更容易。或者甚至将结构解压缩到显式的for循环中,这可能会让你避免使用当前代码中的列表连接之类的东西:
c = []
for root, d, files in os.walk(some_directory):
c.append(root)
c.extend(join(root, fi) for fi in files)