应用错误收集

我有一个问题 - 我被介绍给Ziv-Lempel的一个版本，它只编码3或更长的重复（1或2个字符的重复不被编码 - 字符本身被放置到编码的字符串而不是（m，k）值）。我被问到是否有可能提高ziv Lempel的编码效率（就编码字符串的长度而言 - 而不是时间复杂度）。

我认为就编码字符串的长度而言 - 可能存在一种情况，即在位置p处不编码3长度重复，而是编码从位置p + 1或p + 2开始的重复可能产生更好的结果 - 这也出现在我读到的理论中：我已经添加了一张相关段落的照片，但是没有给出任何例子。到目前为止我设法找到的每个例子都是编码长度为3的重复码的代码也可以检测到的。

以下段落提到了存在这样一个文本的事实：

到目前为止我们描述的压缩算法是 greedy ：报告并立即使用任何长度为3或更长的重复。有时候这不是最优的：我们可以在位置上重复[ m ₁， k ₁]重复> p ，并且[ m ₂， k ₂]重复位置 p +1或 p +2， k ₁＆lt;＆lt; ķ的<子> 2 。因此，非贪婪算法可以改善压缩效果。

(original image)

通过压缩更长的重复次数可以提高ziv lempel的效率

2 个答案: