我收集了大量的ISO文件(每个文件约1GB),它们之间共享了“数据运行”。因此,例如,一个音轨可能是相同的(在5个isos中具有相同的长度和内容),但是在每个音轨中不一定具有相同的名称或位置。
我可以应用一些压缩技术来检测多个文件中的信息并对其进行无损重复数据删除吗?
答案 0 :(得分:0)
对于阅读此书的任何人来说,经过一些实验后发现,通过将所有类似的ISO或CHD文件放入单个7zip归档文件(固态归档文件,最大字典大小为1536MB),我可以通过以下方式实现极高的压缩率:对已经压缩的数据进行重复数据删除。