我有一个用C语言编写的LZW压缩器/解压缩器。
初始表由ASCII字符组成,然后每个现在要保存到表中的字符串由前缀和字符组成,两者都作为int保存在列表中。
我的压缩工作正常但我的解压缩会留下一些角色。
输入:
<title>Agile</title><body><h1>Agile</h1></body></html>
我得到的输出(注意缺少'e'和'&lt;'):
<title>Agile</title><body><h1>Agil</h1></body>/html>
这是我使用的代码(相关部分):
void expand(int * input, int inputSize) {
// int prevcode, currcode
int previousCode; int currentCode;
int nextCode = 256; // start with the same dictionary of 255 characters
dictionaryInit();
// prevcode = read in a code
previousCode = input[0];
int pointer = 1;
// while (there is still data to read)
while (pointer < inputSize) {
// currcode = read in a code
currentCode = input[pointer++];
if (currentCode >= nextCode) printf("!"); // XXX not yet implemented!
currentCode = decode(currentCode);
// add a new code to the string table
dictionaryAdd(previousCode, currentCode, nextCode++);
// prevcode = currcode
previousCode = currentCode;
}
}
int decode(int code) {
int character; int temp;
if (code > 255) { // decode
character = dictionaryCharacter(code);
temp = decode(dictionaryPrefix(code)); // recursion
} else {
character = code; // ASCII
temp = code;
}
appendCharacter(character); // save to output
return temp;
}
你能发现它吗?我很感激。
答案 0 :(得分:4)
您的decode函数返回字符串中的第一个字符。您需要此字符才能将其添加到字典中,但您应该不将previousCode
设置为它。所以你的代码应该是这样的:
...
firstChar = decode(currentCode);
dictionaryAdd(previousCode, firstChar, nextCode++);
previousCode = currentCode;
...