压缩大字节数组,同时保持相似性

时间:2016-09-26 14:48:54

标签: arrays compression

我有两个大字节数组,每个数组大约40000字节。这些阵列的相似度约为90%。我想尽可能地压缩它们,同时仍然能够通过比较压缩数组找到它们大约90%相似。这可以实现吗?

1 个答案:

答案 0 :(得分:0)

您可以为它们构建最佳霍夫曼,然后使用它来压缩它们。它并非100%保证所有类似部件都是相同的,但是,如果足够的话,它接近100%。