为什么同一文件的两个tarball的md5哈希值有所不同?

时间:2016-04-06 23:57:27

标签: linux hash compression md5 tar

我可以跑:

echo "asdf" > testfile
tar czf a.tar.gz testfile
tar czf b.tar.gz testfile
md5sum *.tar.gz

事实证明a.tar.gzb.tar.gz有不同的md5哈希值。确实,他们是不同的,diff -u a.tar.gz b.tar.gz确认。

我需要将哪些附加标志传递给tar,以便其输出在相同输入下随时间保持一致?

2 个答案:

答案 0 :(得分:11)

tar czf outfile infiles相当于

tar cf - infiles | gzip > outfile

文件不同的原因是gzip将其输入文件名和修改时间放入压缩文件中。当输入是管道时,它使用空字符串作为文件名,使用当前时间作为修改时间。

但它也有--no-name选项,告诉它不要将名称和时间戳放入文件中。因此,如果您明确编写扩展命令,而不是使用-z tar选项,则可以使用此选项。

tar cf - testfile | gzip --no-name > a.tar.gz
tar cf - testfile | gzip --no-name > b.tar.gz

我在OS X 10.6.8上进行了测试,但它确实有用。

答案 1 :(得分:0)

对于MacOS:

man tar中,我们可以查看--options部分,我们将在其中找到!timestamp选项,该选项将从gzip存档中排除时间戳。用法:

tar --options '!timestamp' -cvzf archive.tgz filename

对于具有相同名称的相同文件,它将产生相同的md5总和