在寻找长期存储大量数据(主要来自数值计算)的良好选择时,我开始使用xz
存档格式(tar.xz
)。与更常见的tar.gz
(两者都有合理的压缩选项)相比,默认的LZMA压缩提供了明显更好的存档大小(对于我的数据类型)。
然而,第一次谷歌搜索xz
长期使用的安全性,来自following web-page(来自lzip
的一位开发者)
Xz格式不适合长期存档
列出了几个原因,包括:
xz
是容器格式,而不是简单的压缩数据,前面有必要的标题 xz
格式碎片xz
错误检测的多个问题虽然有些问题看起来有点人为,但我想知道,如果任何可靠的理由没有使用xz
作为长期存档的存档格式。
如果我选择xz
作为文件格式,我应该关注什么?
(我想,即使30年后,访问xz
程序本身也不应成为问题)
几个笔记:
tar.gz
甚至普通zip
可能是一个更明显的选择,但削减约30%存档大小的能力对我来说非常有吸引力。答案 0 :(得分:0)
也许正确的问题是,"当存在正确设计的格式时,是否有充分的理由使用如xz这样设计不当的格式进行长期归档?"
例如,IANA时区数据库正在使用gzip和lzip来分发它们永久存档的tarball。
lru_cache
答案 1 :(得分:0)
如果您仔细阅读了链接的页面,您会发现以下内容: https://www.nongnu.org/lzip/xz_inadequate.html#misguided
“xz格式规范对填充的完整性设置了比有效载荷的完整性更严格的要求。规范不保证解压缩数据的完整性将被验证,但它要求解压缩必须是一旦找到损坏的填充字节就中止。“
以下任何一种压缩格式?