Question

我试图更好地理解霍夫曼解码器的工作原理。我有一个代码表，但由于二进制字符串的模糊性，我很难理解解码器的工作方式。

（我在大学的最后一年准备中学习这个）

我的桌子：

Data  Hcode
0,     0
1,     1
2,     10
3,     11
17,    100
18,    101
19,    110
29,    111

如果我有像010011这样的霍夫曼代码字符串，我可以返回许多不同的数据组合，那么我如何辨别呢？

我理解BST表示中的霍夫曼逻辑，并且您遵循给定叶子的路径，该路径类似于（0-255（ascii）之间的给定值的代码）但我仍然不知道如何区分返回数据：0,1,0或数据：0,17

我真的必须在数据0和1上强制执行2位代码吗？（00和01）

我希望我能解释最好的XD

如果你想知道我是如何生成表的 - 你会杀了我因为我没有使用树逻辑来生成它。虽然我在频率上对数据（随机字节）进行了排序 - 我通过将元素位置编号转换为二进制来生成Hcodes（为什么我将这个帖子称为穷人哈夫曼）。

非常感谢您的任何建议。

Answer 1

代码表错误。霍夫曼颂应该是prefix free。这是必要的，以便在之后解码它们而没有含糊之处。

如果您使用二叉树来创建代码，这将自动确保“前缀可用性”。请参阅：http://en.wikipedia.org/wiki/Huffman_coding

现在，我要杀了你......;）

Answer 2

不仅代码表错误，代码长度也错误。如果您有两个一位代码，则您已经用完了所有代码空间，并且没有其他代码。你所展示的不仅是霍夫曼代码而且不是前缀代码 - 它实际上根本不是代码。