标签: arrays compression
我有两个大字节数组,每个数组大约40000字节。这些阵列的相似度约为90%。我想尽可能地压缩它们,同时仍然能够通过比较压缩数组找到它们大约90%相似。这可以实现吗?
答案 0 :(得分:0)
您可以为它们构建最佳霍夫曼,然后使用它来压缩它们。它并非100%保证所有类似部件都是相同的,但是,如果足够的话,它接近100%。