我有一个ZIP压缩网页(.maff)目录,每个网页都是单独压缩的。其中一些网页是同一页面的变体,彼此之间略有不同 - 比如10%不同。我想将整个文件夹(数百个文件)压缩到一个存档中。
理论上,压缩许多相同(10%方差)的文件应该非常有效(~90%)。
但我想知道:单独压缩略有不同的文件的二次压缩效率如何?至少,理论上呢?
当以这种两阶段方式应用时,什么压缩算法失去了最小的力量?
也许,应该在第一和第二阶段使用不同的算法来最大化整体压缩? (但在我的情况下,MAFF标准将第一个算法修正为ZIP压缩)。