如何从中间搜索尝试

时间:2019-02-06 20:08:14

标签: algorithm search data-structures trie

我继续遇到这种情况,我有一个trie分支,我想在它的中间向下匹配。因此,例如,我可能有这个trie分支之类的东西。

foo {
  bar {
    baz {
      hello {
        world {
          123 {
            456 {
              abc {
                xyz
              }
            }
          }
        }
      }
    }
  }
}

这是它的简化版本。实际上,它可能是具有100个级别的二进制特里,例如10101011011010100110000101......,如下所示:

1 {
  0 {
    1 {
      0 {
        1 {
          ...
        }
      }
    }
  }
}

但是在带有字符串键的简化示例中,完整路径如下所示:

foo/bar/baz/hello/world/123/456/abc/xyz

通常尝试从顶部开始并部分或完全向下移动。因此,您可能会在部分路径中找到匹配项。

foo/bar/baz/hello/world/123/

或者您可以在这里找到一个:

foo/bar/baz/

尝试很容易,您只需从顶部开始,然后一直向下。这些共同点是它们从分支的顶部开始

但是我想知道的是不同的。我想知道如何从三叉戟的中间开始。例如,我想这样匹配:

/world/123/456/

基本上像正则表达式*/world/123/456/*,在其中匹配

问题是,如果Trie密集,那么从理论上讲,整个Trie可能会散布成千上万个节点。因此,像/world/123/456/中向下匹配5层可能意味着在找到匹配项之前先扫描1000个上层Trie节点。

我想知道您在这种情况下该怎么做,可能的解决方案是什么。我目前能想到的就是以某种方式使分支中间成为自己的顶级特里,在内存中的另一个位置复制特里的嵌套部分。但是,这似乎确实是效率低下,浪费的空间和内存,这就是为什么我想知道您将如何解决这个问题。

1 个答案:

答案 0 :(得分:0)

从技术上讲,特里树中的每个节点都是特里树。您可以将其视为该子树的根。

您可以通过保留哈希表来利用此哈希表,该哈希表将每个节点的值映射到trie中的相应节点。如果节点可以有重复的值,则使每个值映射到节点列表。

如果需要在Trie的中间搜索值,则可以使用哈希表立即跳转到Trie中以起始值开头的节点。然后,对于每个这些节点,您都可以搜索值,就好像该节点是某个地方的顶级trie的根一样。