使用霍夫曼树解码二进制文本

时间:2018-11-24 03:34:28

标签: c++ tree huffman-code inorder postorder

以下代码段未返回正确的文本。该代码采用指向霍夫曼代码树根节点的指针和二进制文本,然后将其转换。但是,每次返回一个重复的字母。

string decode(Node *root, string code) {
    string d = ""; char c; Node *node = root;
    for (int i = 0; i < code.size(); i++) {
        node = (code[i] == '0') ? node->left_child : node->right_child;
        if ((c = node->value) < 128) {
            d += c;
            node = root;
        }
    }
    return d;
}

Node对象的代码:

class Node {
public:
  Node(int i, Node *l = nullptr, Node *r = nullptr) {
      value = i;
      left_child = l;
      right_child = r;
  }
  int value;
  Node *left_child;
  Node *right_child;
};

用于构建树的代码:

Node* buildTree(vector<int> in, vector<int> post, int in_left, int in_right, int *post_index) {
    Node *node = new Node(post[*post_index]);
    (*post_index)--;

    if (in_left == in_right) {
        return node;
    }

    int in_index;
    for (int i = in_left; i <= in_right; i++) {
        if (in[i] == node->value) {
            in_index = i;
            break;
        }
    }

    node->right_child = buildTree(in, post, in_index + 1, in_right, post_index);
    node->left_child = buildTree(in, post, in_left, in_index - 1, post_index);

    return node;
}

示例树:

        130
       /   \
     129    65
    /   \
  66     128
        /   \
      76     77 

I / O示例: 输入:101010010111 输出:A�A�A��A�AAA

菱形字符是大于128的数字。

1 个答案:

答案 0 :(得分:0)

您正在将值放在char中,对于大多数C ++编译器来说,该值都是带符号的。但不是全部-char是带符号的还是无符号的是实现定义的。一个有符号的char介于–128到127之间,因此它总是小于128。 (您的编译器应该对此有所警告。)

您需要使用int c;代替char c;中的decode(),然后执行d += (char)c;。然后,您的第一个代码段将正确返回ALABAMA

顺便说一句,decode()中需要进行错误检查,以确保您以等于node的{​​{1}}退出循环。否则,提供的某些位以代码的中间结尾,因此不会被解码为符号。