如何使用rsync以递归方式计算目录中可用文件的数量?

时间:2013-07-09 07:13:10

标签: python rsync python-2.6

我想在Python中使用rsync在远程服务器路径中递归计算文件数?我试过这样做:

def find_remote_files(source, password):
    cmdline = ['sshpass', '-p', password, 'rsync', '--recursive', source]
    with open(os.devnull, "w") as devnull:
        proc = subprocess.Popen(cmdline, stdout=subprocess.PIPE, stderr=devnull)
        try:
            for entry in proc.stdout:
                items = entry.strip().split(None, 4)
                if not items[0].startswith("d"):
                    yield lent(items[4])
            proc.wait()
        except:
            # On any exception, terminate process and re-raise exception.
            proc.terminate()
            proc.wait()
            raise

它适用于我的文件较少的情况。但是如果我有超过3000个文件,rsync将花费很长时间将其存储在列表中并再次计算长度。这就是为什么,我想知道是否有rsync命令来计算文件。

1 个答案:

答案 0 :(得分:2)

我会使用另一种使用fabric的方法,这是一个执行远程命令的好工具。

from fabric.api import run, env  
env.host_string = 'example.org'
output = run('find /tmp -type f | wc -l')
num_files = int(output)

现在您拥有变量num_files中的文件数量。我只是使用find命令从目录/tmp开始递归搜索文件,并使用wc -l计算返回的行。