带压缩的rsync备份,文件大小差异

时间:2014-03-23 16:22:18

标签: backup rsync

我正在使用rsync将文件夹定期备份到另一台服务器,如下所示,创建一个重复的故障安全版本。

rsync --partial --progress -avzl -e ssh /backup_source user@backupserver.com:/backup_dest/ >> /backup.log

据我所知,它在传输文件时使用压缩。我注意到目标文件夹的存储使用情况有一些不寻常的差异。根据目标文件夹上使用的命令,我得到:

ls -lart :返回相同的文件列表,文件大小匹配src / dest

du :目标返回的文件夹大小为源文件夹中相同du结果的20-50%。

如果我在源/目的地的同一文件上运行“du [filename]”比较,则目标再次是20-50%的大小。内容通常是文本,看起来是完整的。

如何解释此文件大小差异?是否有某种压缩转移到目标文件?然而,文件如何在内容上看起来相同但占用的空间更少?困惑。

修改

md5sum比较几个文件返回相同的结果,这是一个好兆头。仍然对“du”感到好奇。或者更可靠的方法来比较目录结构的文件大小。

1 个答案:

答案 0 :(得分:2)

我认为你所看到的可能是基于文件系统的磁盘使用量的差异。请记住,du并不真正显示文件大小,而是“文件空间使用”的“估计”。 lsstat是文件大小的准确描述。

不要将filesize用作校验和。如果你想确保2个文件完全相同,请使用真正的校验和 - 或者一些(md5 / sha想到)。如果您认为您可能会看到哈希冲突(极不可能),请使用2个校验和。在同一输入数据上具有2个具有不同校验和的哈希冲突的可能性是无穷小的。