使用Python的os.walk函数和ls命令获得了不同的结果

时间:2012-08-10 20:21:10

标签: python linux bash python-2.7

#!/bin/python
import os
pipe=os.popen("ls /etc -alR| grep \"^[-l]\"|wc -l")         #Expr1
a=int(pipe.read())
pipe.close()
b=sum([len(files) for root,dirs,files in os.walk("/etc")])  #Expr2
print a
print b
print "a equals to b ?", str(a==b)  #False
print "Why?"

Expr1 的功能与 Expr2 之间的差异是什么? 我认为 Expr1 会给出正确答案,但不确定。

3 个答案:

答案 0 :(得分:4)

简答:

ls -laR | grep "^[-l]"将符号链接计入目录。 它匹配以l开头且包含符号链接到目录的任何行。

相比之下,[files for root, dirs, files in os.walk('/etc')] 不计算符号链接到目录。它忽略所有目录并仅列出文件。


答案很长:

以下是我发现差异的方法:

import os
import subprocess
import itertools

def line_to_filename(line):
    # This assumes that filenames have no spaces, which is a false assumption
    # Ex: /etc/NetworkManager/system-connections/Wired connection 1
    idx = line.rfind('->')
    if idx > -1:
        return line[:idx].split()[-1]
    else:
        return line.split()[-1]

line_to_filename尝试在ls -laR的输出中找到文件名。

这定义了expr1expr2,与您的代码基本相同。

proc=subprocess.Popen(
    "ls /etc -alR 2>/dev/null | grep -s \"^[-l]\" ", shell = True,
    stdout = subprocess.PIPE)         #Expr1
out, err = proc.communicate()
expr1 = map(line_to_filename, out.splitlines())

expr2 = list(itertools.chain.from_iterable(
    files for root,dirs,files in os.walk('/etc') if files))  #Expr2

for expr in ('expr1', 'expr2'):
    print '{e} is of length {l}'.format(e = expr, l = len(vars()[expr]))

这会删除expr1中的expr2名称

for name in expr2:
    try:
        expr1.remove(name)
    except ValueError:
        print('{n} is not in expr1'.format(n = name))

删除expr1expr2共享的文件名后,

print(expr1) 

产量

['i386-linux-gnu_xorg_extra_modules', 'nvctrl_include', 'template-dkms-mkdsc', 'run', '1', 'conf.d', 'conf.d']

然后我使用find/etc中查找这些文件,并尝试猜测这些文件的异常情况。它们是目录(而不是文件)的符号链接。

答案 1 :(得分:1)

如果使用walk,则会忽略错误(请参阅this),并且ls会针对每个错误发送消息。这些算作单词。

答案 2 :(得分:0)

在我的机器上,/ etc是/ private / etc的符号链接,因此ls /etc只有一行输出。 ls /etc/给出了lsos.walk之间预期的等效性。