应用错误收集

压缩大字节数组，同时保持相似性

时间：2016-09-26 14:48:54

标签： arrays compression

我有两个大字节数组，每个数组大约40000字节。这些阵列的相似度约为90％。我想尽可能地压缩它们，同时仍然能够通过比较压缩数组找到它们大约90％相似。这可以实现吗？

1 个答案:

答案 0 :(得分：0)

您可以为它们构建最佳霍夫曼，然后使用它来压缩它们。它并非100％保证所有类似部件都是相同的，但是，如果足够的话，它接近100％。