在patricia trie中查找所有作为字符串前缀的键

时间:2019-02-10 20:05:08

标签: java apache-commons trie patricia-trie

我正在尝试查找存储在trie中的所有键,这些键是字符串的有效前缀。

示例: 给定一个包含“ ab”,“ abc”,“ abcd”,“ bc”和“ bcd”的特里。在Trie中搜索字符串“ abcdefg”应产生“ abcd”,“ abc”,“ ab”。

我想为Java使用appache commons patricia trie实现,但它似乎不支持这种查找。是否有其他替代解决方案或简单的解决方案?

1 个答案:

答案 0 :(得分:0)

我本人还没有使用过Apache Commons PatriciaTrie,但据我检查,您可以轻松地仅获得带有某些字符串前缀的单词映射。我发现的大多数示例还提供诸如插入,查找之类的基本操作。我还遇到了一些有关在番石榴中实现Trie的讨论,但没有什么真正具体的。

因此,这是我对自定义实现的简单建议(但使用自定义实现时,应该进行一系列的测试)。

public class SimpleTrie {

    private static final int ALPHABET_COUNT = 26;

    class TrieNode {
        char value;
        TrieNode[] children;
        boolean isValidWord;

        TrieNode() {
            this(' ');
        }

        TrieNode(char value) {
            this.value = value;
            children = new TrieNode[ALPHABET_COUNT];
            isValidWord = false;
        }
    }

    private TrieNode root = new TrieNode();

    public void insert(String word) {
        TrieNode current = root;

        for (int i = 0; i < word.length(); i++) {
            char c = word.charAt(i);

            if (current.children[c - 'a'] == null) {
                current.children[c - 'a'] = new TrieNode(c);
            }

            current = current.children[c - 'a'];
        }

        current.isValidWord = true;
    }

    public List<String> findValidPrefixes(String word) {
        List<String> prefixes = new ArrayList<>();
        TrieNode current = root;

        StringBuilder traversedPrefix = new StringBuilder();

        for (int i = 0; i < word.length(); i++) {
            char c = word.charAt(i);

            if (current.children[c - 'a'] != null) {
                current = current.children[c - 'a'];
                traversedPrefix.append(c);

                if (current.isValidWord) {
                    prefixes.add(traversedPrefix.toString());
                }
            }
        }

        return prefixes;
    }

    public static void main(String[] args) {
       SimpleTrie trie = new SimpleTrie();

        // insert "ab", "abc", "abcd", "bc" and "bcd"
        trie.insert("ab");
        trie.insert("abc");
        trie.insert("abcd");
        trie.insert("bc");
        trie.insert("bcd");

        List<String> validPrefixes = trie.findValidPrefixes("abcdefg");

        System.out.println(validPrefixes);
    }
}