Java的前缀匹配/ trie?

时间:2010-02-09 19:08:41

标签: java collections

我正在将一个C程序移植到Java。我需要做前缀查找。

e.g。如果密钥"47" , "4741", "4742输入"474578"应该产生"47"的值,"474153"将匹配"4741"密钥。

在C中我实现了这个用trie控制大约100k键,我只需要关心包含ascii chars [0-9]的键,不需要关心完全吹制的unicode字符串。

无论如何,我可以使用任何现有的Java库吗?

1 个答案:

答案 0 :(得分:3)

假设您不想通过最长的匹配键进行查找,则可以使用简单的实现this looks like to be what you need。这里使用的CharSequence接口由java.lang.String

实现

AFAIK在JRE库中没有这样的类。

我可以尝试使用排序数组和修改后的二进制搜索

import java.util.ArrayList;
class Item {
    public Item(String key, String val) {
        this.key = key;
        this.val = val;
    }
    String key;
    String val;
};
public class TrieSim {

    private static Item binarySearch(Item[] a, String key) {
        int low = 0;
        int high = a.length - 1;

        while (low <= high) {
            int mid = (low + high) >>> 1;
            int len = Math.min(key.length(),a[mid].key.length());
            String midVal = a[mid].key.substring(0,len);
            String cmpKey = key.substring(0,len);
            System.out.println( midVal + " ~ " + cmpKey );
            if (midVal.compareTo( cmpKey ) >0 ) 
                low = mid + 1;
            else if (midVal.compareTo( cmpKey) <0 )
                high = mid - 1;
            else
                return a[mid];
        }
        return null;
    }

    public static void main(String[] args) {

        ArrayList<Item> list = new ArrayList<Item>();
        list.add(new Item("47", "val of 47 "));
        list.add(new Item("4741", "val of 4741 "));
        list.add(new Item("4742", "val of 4742 "));
        Item[] array = new Item[list.size()];
        // sorting required here
        array = (Item[]) list.toArray( array );

        for (Item i : array) {
            System.out.println(i.key + " = " + i.val);
        }
        String keys[] = {  "474578" , "474153" };
        for ( String key : keys ) {
            Item found = binarySearch(array, key );
            System.out.println( key + " -> " + (found == null ?" not found" : found.val ));
        }   
    }
}