在自适应基数树中搜索字符串

时间:2017-11-19 22:18:51

标签: database indexing data-structures radix-tree

我一直在阅读“自适应基数树”的研究论文: 主内存数据库的ARTful索引“,我有一个关于如何将字符串与节点的键匹配的查询。例如:如果我有一个词:Iota,这是主键(标识符)我的表格中有一个元组。我必须从A开始搜索它,比如Alpha到Zeta。为简单起见,请只考虑10个值:Alpha,Beta,Delta,Gamma,Kappa,Iota,Phi,Psi, Rho,Zeta。你会怎么做呢?

参考研究论文:https://db.in.tum.de/~leis/papers/ART.pdf

1 个答案:

答案 0 :(得分:1)

对我而言,本文看起来只描述了具有不同内部节点类型的常规Trie结构(包含4个,16个或256个条目,并且在较小的情况下需要二进制搜索)。作者似乎也以某种方式压缩了单个子节点的链。

我不认为用示例键很好地描述结构,因为它们将在根节点上具有所有单独的条目(文章中的类型为16),除非对于Phi和Psi来说," P"输入将导致4节点的条目为" h"和" s"。所有剩余的条目都将是优化的单节点链。

请注意,在现实世界的情况下,与今天的堆内存大小相比,通常没有那么多不同的单词,所以我不会考虑"异国情调"数据结构,直到有一个真正的案例很可能从中获利。