我正在从论文中实现算法,其中一部分要求使用"哈希树"。由于我从未听说过数据结构I looked it up。事实证明,名称哈希树是不明确的,可用于指代三种不同类型的数据结构。他们是:
在阅读了每种类型的数据结构后,我非常确定该文件正在使用Merkle树,但我想得到第二种意见。
相关论文为Fast Algorithms for Mining Association Rules,我所指的具体部分可在第2.1.2节的第4页找到。
我引用了以下相关文字的一部分。
候选项目集Ck存储在哈希树中。哈希树的节点 要么包含项目集(叶子节点),要么包含哈希表(内部节点)。在内部节点中,散列表的每个桶指向另一个节点。哈希树的根被定义为深度1.深度d处的内部节点指向深度为d + 1的节点。项目集存储在叶子中。当我们添加一个项集c时,我们从根开始 沿着树走下去,直到我们到达一片叶子。在深度为d的内部节点处,我们通过将哈希函数应用于项集的第d项来决定要遵循的分支。最初将所有节点创建为叶节点。当叶节点中的项集数超过指定阈值时,叶节点将转换为内部节点。
还应该注意的是,这种特定的数据结构在基于先验算法的其他数据挖掘论文中提到,例如在关于循环关联规则的this论文中。由于它是一种经常使用的数据结构,我想阅读更多关于不仅仅是几篇论文中的两个段落。
答案 0 :(得分:2)
哈希树和Merkle树是一样的。因此,如果论文提到了一个哈希树,它就是一个Merkle树,反之亦然。为了阐明使用散列或Merkle树的Apriori算法的概念,请参阅第344页和第3页。 345:https://www-users.cs.umn.edu/~kumar/dmbook/ch6.pdf。