我目前正在一个项目中,在该项目中,我需要打印出与给定前缀匹配的特里词,这些词是由用户使用字符串向量给出的,用于打印出这些词。但是,我在开始这项工作时遇到了麻烦,很喜欢你们能给我的任何建议。
这是我的意思的一个例子
特里语单词{应用,地址,添加,乞求,母牛,老鼠} 给定广告前缀 使用向量来打印包含前缀ad的单词: 地址 添加
非常感谢您提供的任何帮助。
答案 0 :(得分:0)
这在很大程度上取决于trie的实现,尽管我在下面提供了一个trie示例。
每个特里包含三样东西:
基于此,我们可以做一些事情,例如将单词添加到Trie中,检查单词是否在Trie中,然后对Trie中的所有单词应用函数。我提供了执行这些功能的成员函数。
#include <memory>
#include <iterator>
struct WordTrie {
static int index_from_char(char c) {
return (unsigned char)c;
}
static int char_from_index(int index) {
return (char)(unsigned char)index;
}
std::unique_ptr<WordTrie[]> branches;
WordTrie* root;
bool is_complete_word = false;
// Make an empty Trie
WordTrie() : branches(nullptr), root(nullptr) {}
// Make a WordTrie with the given root
WordTrie(WordTrie* root) : branches(nullptr), root(root) {}
int get_index_in_root() const {
WordTrie const* branch_zero = root->branches.get();
return std::distance(branch_zero, this);
}
void append_char(std::string& s) {
if(root != nullptr) {
s += char_from_index(get_index_in_root());
}
}
void add_word(char const* str, int length) {
if(length > 0) {
char c = *str;
if(branches == nullptr) {
branches.reset(new WordTrie[256]);
for(int i = 0; i < 256; i++) {
branches[i].root = this;
}
}
branches[index_from_char(c)].add_word(str + 1, length - 1);
} else {
is_complete_word = true;
}
}
bool has_word(char const* str, int length) {
if(length == 0) {
return is_complete_word;
}
return branches[index_from_char(*str)].has_word(str + 1, length - 1);
}
bool has_word(std::string const& s) {
return has_word(s.data(), s.size());
}
template<class F>
void apply_over_words_in_trie(std::string const& word, F&& func) {
if(is_complete_word) {
func(word);
}
// Exit if there are no branches
if(branches == nullptr) return;
//Add character to 'word'
std::string new_word = word + '_';
for(int i = 0; i < 256; i++) {
new_word.back() = char_from_index(i);
branches[i].apply_over_words_in_trie(new_word, func);
}
}
};
答案 1 :(得分:0)
首先,特里是一棵树。
在特里树中,具有给定前缀(例如ad
)的所有单词实际上都存储在您的特里树的子树中,在搜索前缀ad
时可以访问该子树。
因此,要打印您的特里树中所有具有给定前缀的单词,需要两个步骤:
node
node
为根的子树中的所有单词。这是一个伪代码:
find_all_words_starting_with(string prefix, trieNode node, int depth){
if (depth == length(prefix)){
suffix = empty_string
print_all_words_with_prefix(prefix, suffix, node)
} else {
letter = prefix[depth]
if (node.hasChild(letter)){
find_all_words_starting_with(prefix, node.getChild(letter), depth+1)
} else { // no word with the correct prefix
return
}
}
}
print_all_words_with_prefix(prefix, suffix, node){
if (node.isCompleteWord){
print(prefix + suffix)
}
for each letter c in the alphabet {
if (node.hasChild(c)){
print_all_words_with_prefix(prefix, suffix + c, node.getChild(c))
}
}
}
find_all_words_starting_with
完成了工作的第一部分。它找到与前缀相对应的节点,并调用第二个函数print_all_words_with_prefix
,该函数将在子树中打印所有完整的单词。