Patricia Trie的特里

时间:2013-06-30 07:55:05

标签: java search-engine trie patricia-trie

我正在尝试编写一个简单的搜索引擎,它使用trie(一个节点只包含一个字符)数据结构来查找单词。当它从用户那里得到“压缩”命令时,trie应该变成a patricia trie的形式。(一个节点包含与子女共同的字符串)

我已经完成了连接字符串部分,但问题是与父母连接的子节点仍在那里。(它们应该被删除。)我想,通过编写一个“清晰”的方法,我可以处理它

这是我的解决方案,但它不起作用:

public void toPatriciaTrie() {
    toPatriciaTrie(root);
    clearTheTrie(root); // the method call is here.
}

public void clearTheTrie(Node<String> v) {
    for (Node<String> w : v.getChildren()) {
                    // finds out if the parent contains the children
                    // if yes, deletes the children.
        if (v.getElement().indexOf(w.getElement()) != -1) {
            w = null;
        }
        else if (w != null) {
            clearTheTrie(w);
        }
    }

}

这是主要的和输出:

主:

public static void main(String[] args) {
    Trie trie = new Trie();
    System.out.println("false " + trie.contains("stack"));
    // here the second one is the name of the file containing the word 
    // and the other one is its index in the file.
    trie.addToTrie("stack", "asd.txt", 3);
    trie.addToTrie("star", "asd.txt", 5);
    trie.addToTrie("jaws", "asdf.txt", 7);
    trie.addToTrie("java", "asdadsad.txt", 9);
    System.out.println("true " + trie.contains("stack"));
    System.out.println("true " + trie.contains("star"));
    System.out.println("true " + trie.contains("jaws"));
    System.out.println("true " + trie.contains("java"));
    trie.print();
    trie.toPatriciaTrie();
    System.out.println();
    trie.print();
}

输出:

false false
true true
true true
true true
true true
j a v a w s s t a r c k 
ja a va a ws s sta ta a r ck k 

我该如何处理这个问题?任何帮助将不胜感激。非常感谢!

1 个答案:

答案 0 :(得分:0)

问题是你如何试图清理孩子。

这部分:

for (Node<String> w : v.getChildren()) {
                // finds out if the parent contains the children
                // if yes, deletes the children.
    if (v.getElement().indexOf(w.getElement()) != -1) {
        w = null;
    }
    ....
}

不删除子节点,它将对子节点的引用设置为null,但它使子节点保持完整。你必须告诉v去除孩子。