我想在Python中使用rsync在远程服务器路径中递归计算文件数?我试过这样做:
def find_remote_files(source, password):
cmdline = ['sshpass', '-p', password, 'rsync', '--recursive', source]
with open(os.devnull, "w") as devnull:
proc = subprocess.Popen(cmdline, stdout=subprocess.PIPE, stderr=devnull)
try:
for entry in proc.stdout:
items = entry.strip().split(None, 4)
if not items[0].startswith("d"):
yield lent(items[4])
proc.wait()
except:
# On any exception, terminate process and re-raise exception.
proc.terminate()
proc.wait()
raise
它适用于我的文件较少的情况。但是如果我有超过3000个文件,rsync将花费很长时间将其存储在列表中并再次计算长度。这就是为什么,我想知道是否有rsync
命令来计算文件。
答案 0 :(得分:2)
我会使用另一种使用fabric的方法,这是一个执行远程命令的好工具。
from fabric.api import run, env
env.host_string = 'example.org'
output = run('find /tmp -type f | wc -l')
num_files = int(output)
现在您拥有变量num_files
中的文件数量。我只是使用find
命令从目录/tmp
开始递归搜索文件,并使用wc -l
计算返回的行。