如何在给定特定前缀的情况下使用向量打印出Trie中的单词

时间:2019-04-08 21:54:27

标签: c++ vector insert trie

我目前正在一个项目中,在该项目中,我需要打印出与给定前缀匹配的特里词,这些词是由用户使用字符串向量给出的,用于打印出这些词。但是,我在开始这项工作时遇到了麻烦,很喜欢你们能给我的任何建议。

这是我的意思的一个例子

特里语单词{应用,地址,添加,乞求,母牛,老鼠} 给定广告前缀 使用向量来打印包含前缀ad的单词: 地址 添加

非常感谢您提供的任何帮助。

2 个答案:

答案 0 :(得分:0)

这在很大程度上取决于trie的实现,尽管我在下面提供了一个trie示例。

每个特里包含三样东西:

  • 一堆树枝
  • 根(可能为空)
  • 说明此Trie是否代表完整单词的布尔符号

基于此,我们可以做一些事情,例如将单词添加到Trie中,检查单词是否在Trie中,然后对Trie中的所有单词应用函数。我提供了执行这些功能的成员函数。

#include <memory>
#include <iterator>

struct WordTrie {
    static int index_from_char(char c) {
        return (unsigned char)c; 
    }
    static int char_from_index(int index) {
        return (char)(unsigned char)index; 
    }
    std::unique_ptr<WordTrie[]> branches; 
    WordTrie* root; 
    bool is_complete_word = false; 
    // Make an empty Trie
    WordTrie() : branches(nullptr), root(nullptr) {}
    // Make a WordTrie with the given root
    WordTrie(WordTrie* root) : branches(nullptr), root(root) {}


    int get_index_in_root() const {
        WordTrie const* branch_zero = root->branches.get();
        return std::distance(branch_zero, this); 
    }
    void append_char(std::string& s) {
        if(root != nullptr) {
            s += char_from_index(get_index_in_root()); 
        }
    }
    void add_word(char const* str, int length) {
        if(length > 0) {
            char c = *str; 
            if(branches == nullptr) {
                branches.reset(new WordTrie[256]); 
                for(int i = 0; i < 256; i++) {
                    branches[i].root = this; 
                }
            }
            branches[index_from_char(c)].add_word(str + 1, length - 1); 
        } else {
            is_complete_word = true; 
        }
    }
    bool has_word(char const* str, int length) {
        if(length == 0) {
            return is_complete_word; 
        }
        return branches[index_from_char(*str)].has_word(str + 1, length - 1); 
    }
    bool has_word(std::string const& s) {
        return has_word(s.data(), s.size()); 
    }
    template<class F>
    void apply_over_words_in_trie(std::string const& word, F&& func) {
        if(is_complete_word) {
            func(word); 
        }

        // Exit if there are no branches
        if(branches == nullptr) return; 
        //Add character to 'word'
        std::string new_word = word + '_';
        for(int i = 0; i < 256; i++) {
            new_word.back() = char_from_index(i); 
            branches[i].apply_over_words_in_trie(new_word, func); 
        }
    }
};

答案 1 :(得分:0)

首先,特里是一棵树。

在特里树中,具有给定前缀(例如ad)的所有单词实际上都存储在您的特里树的子树中,在搜索前缀ad时可以访问该子树。
因此,要打印您的特里树中所有具有给定前缀的单词,需要两个步骤:

  1. 找到与您的前缀相对应的节点node
  2. 列出以node为根的子树中的所有单词。

这是一个伪代码:

find_all_words_starting_with(string prefix, trieNode node, int depth){
    if (depth == length(prefix)){
        suffix = empty_string
        print_all_words_with_prefix(prefix, suffix, node)
    } else {
        letter = prefix[depth]
        if (node.hasChild(letter)){
            find_all_words_starting_with(prefix, node.getChild(letter), depth+1)
        } else { // no word with the correct prefix
            return
        }
    }
}

print_all_words_with_prefix(prefix, suffix, node){
    if (node.isCompleteWord){
        print(prefix + suffix)
    }
    for each letter c in the alphabet {
        if (node.hasChild(c)){
            print_all_words_with_prefix(prefix, suffix + c, node.getChild(c))
        }
    }
}

find_all_words_starting_with完成了工作的第一部分。它找到与前缀相对应的节点,并调用第二个函数print_all_words_with_prefix,该函数将在子树中打印所有完整的单词。