如何打印存储在树中的所有单词,wherin trie是否已使用Java中的Hashmap实现?

时间:2013-04-15 04:21:02

标签: java hashmap trie

我想打印或检索存储在Trie Data Structure中的所有单词。这是因为我想计算拼写错误的单词和词典中的单词之间的编辑距离。 因此我想从Trie中检索每个单词并计算编辑距离。 但我无法找回。我想要一些代码片段。 这就是我在Java中使用HashMap实现Trie的方法

现在请告诉我如何编写用于打印存储在T​​rie中的所有单词的代码。非常感谢任何帮助

TrieNode.java

package triehash;
import java.io.Serializable;
import java.util.HashMap;

public class TrieNode implements Serializable {

HashMap<Character, HashMap> root;

public TrieNode() {
   root = new HashMap<Character, HashMap>();   
   }
}

TrieDict.java

package triehash;

import java.io.FileOutputStream;
import java.io.ObjectOutputStream;;
import java.io.Serializable;
import java.util.HashMap;
import java.io.Serializable;

public class TrieDict {   
 public  TrieNode createTree()
 {
     TrieNode t = new TrieNode();
     return t;
 }

 public void add(String s, TrieNode root_node) {
    HashMap<Character, HashMap> curr_node = root_node.root;
    s = s.toLowerCase();
    for (int i = 0, n = s.length(); i < n; i++) {
        Character c = s.charAt(i);
        if (curr_node.containsKey(c))
            curr_node = curr_node.get(c);
        else {
            curr_node.put(c, new HashMap<Character, HashMap>());
            curr_node = curr_node.get(c);
        }
    }
    curr_node.put('\0', new HashMap<Character, HashMap>(0)); // term
  }

 public void serializeDict(TrieNode root_node)
 {    
   try{
        FileOutputStream fout = new FileOutputStream("/home/priya/NetBeansProjects/TrieHash/dict.ser");

    ObjectOutputStream oos = new ObjectOutputStream(fout);   
    oos.writeObject(root_node);
    oos.close();
    System.out.println("Done");

   }catch(Exception ex){
       ex.printStackTrace();
   }
}

 public void addAll(String[] sa,TrieNode root_node) {
    for (String s: sa)
        add(s,root_node);
 }

 public static void main(String[] args)
 {
    TrieDict td = new TrieDict();
    TrieNode tree = td.createTree();

    String[] words = {"an", "ant", "all", "allot", "alloy", "aloe", "are", "ate", "be"};
    for (int i = 0; i < words.length; i++)
      td.add( words[i],tree);       
    td.serializeDict(tree); /* seriliaze dict*/
 }   
}

1 个答案:

答案 0 :(得分:0)

首先,值得注意的是root实例变量的声明类型有点奇怪。 (具体来说,HashMap<Character,HashMap>的值类型排除了您更喜欢使用的一些泛型。)下面的代码应该可以使用,但是由于这个原因,您会收到一些警告。您可以尝试重构代码以使用类型HashMap<Character,TrieNode>。对不起,如果那是迂腐的。 :)

试试这个,作为方法添加到TrieNode

public Set<String> computeWords() {
    Set<String> result;

    if(root.size() == 0)
        result = new HashSet<String>();
    else
        result = computeWords(root, "");

    return result;
}

protected static Set<String> computeWords(HashMap tree, String prefix) {
    Set<String> result=new HashSet<String>();

    if(tree.size() == 0)
        result.add(prefix);
    else
        for(Object o : tree.keySet()) {
            Character c=(Character) o;
            prefix = prefix+c;
            result.addAll(computeWords((HashMap) tree.get(c), prefix));
            prefix = prefix.substring(0, prefix.length()-1);
        }

    return result;
}

对于给定的TrieNode对象tt.computeWords()会返回t中编码的所有单词的集合。

我相信这回答了你想问的问题。但是,要回答标题中所述的问题,您可以打印相同t的所有字词,如下所示:

for(String word : t.computeWords())
    System.out.println(word);

此外,这肯定不是最有效的实现,特别是因为我们在HashSet中创建了一堆computeWords(HashMap,String)个对象,但它应该可以工作!

编辑:此代码还假定您使用空HashMap来终止字词。如果您使用null终止字词,则需要使用if(tree.size() == 0)更新static方法中的if(tree == null)支票。对不起,本来应该打电话给你。

编辑:解释如何打印所有单词,以防万一不清楚。

编辑:修复了空的案例。